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ELEMENTS DE L'ALGÈBRE DE BOOLE 


par 


M. J. VILLE 


Professeur 


1 ALGÈBRE DES CLASSES 


1. 1. - INVERSES ET RECIPROQUES 


Il est d'usage, au début des cours de Mathématiques, de donner quel- 
ques définitions concernant la structure des théorèmes. Il est entendu par 
exemple qu'un axiome est une vérité si évidente qu'on ne la démontre pas, 
qu'un postulat est une vérité indémontrable mais que l'on admet, qu'un théo- 
rème comporte une hypothèse et une conclusion. Ces quelques définitions 
suffisent à donner de la nature du raisonnement mathématique une idée suf- 
fisante pour que les élèves puissent faire les premiers pas; par la suite, 
ils apprennent à raisonner en raisonnant sur de nombreux cas particuliers. 
Il arrive cependant un moment de l'étude où il est nécessaire de se pencher 
de plus près sur la structure des raisonnements; il est impossible, sans ce 
faire, de comprendre le sens et la portée de la phrase :le Postulatum 
d'Euclide est indémontrable, qui ne signifie pas : Personne n'a réussi, 
faute d'habileté, à en trouver la démonstration, mais bien : On peut démon- 
trer qu'il est indémontrable. Sans nous attacher à une question aussi déli- 
cate que celle du Postulatum d'Euclide, revenons à des questions élémen- 
taires, telles que celles qui se posent lorsque l'on explique en quoi consiste 
une condition nécessaire et suffisante, ou encore, ce qui revient au même 
mais dans un autre langage, lorsque l'on parle de la réciproque d'un théo- 
rème . Rappelons qu'unthéorème comporte une hypothèse, que nous pouvons 
représenter par la lettre H et une conclusion que nous pouvons représenter 
par la lettre C. L'énoncé du théorème consiste à dire : si H est vraie, alors 
C l'est également. Cette relation entre H et C est appelée une implication; 
on peut l'exprimer encore en disant que H (hypothèse) implique C (conclu- 
sion) 3 

Si on représente cette implication par le signe ——, on obtient le sché- 
ma suivant : 


Hypothèse : H 
Conclusion : C 
Théorème : H—=c 
Par exemple, le théorème : Toute fonction dérivable est continue, a 
pour hypothèse : 
H : f(x) admet une dérivée f'(x) 
et pour conclusion : 


C : f(x) est continue 
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Si le théorème H——>C est vrai, H constitue une condition suffisante 
de C, et C constitue une condition nécessaire de H. Dans l'exemple ci- 
dessus, le théorème indique que pour démontrer la continuité d'une fonc- 
tion, il suffit de démontrer sa dérivabilité; de même, si on veut montrer 
qu'une fonction est dérivable, il est bon de s'assurer qu'elle est continue, 
parce que si elle ne l'est pas, elle ne peut être dérivable. Portons notre 
attention sur la dernière phrase, qui peut se dire également : 


Toute fonction non continue est non dérivable. 


On peut la considérer comme un théorème, ayant pour hypothèse la 
négation de la conclusion du théorème primitif; nous noterons cette négation 
par C. Quant à la conclusion, c'est la négation, que nous noterons H, de 
l'hypothèse primitive. Nous sommes en présence de deux théorèmes que 


nous notons : 


nc 
CR 
Ces deux théorèmes n'en font en réalité qu'un seul. C'est ce qu'on 
exprime lorsque l'on dit qu'un théorème quelconque et l'inverse de sa ré- 
ciproque sont équivalents. Ouvrons ici une parenthèse pour rappeler les 
significations des expressions ‘'inversement''et ''réciproquement'', qui sont 
tout à fait distinctes. L'inverse du théorème H—+C est le théorème H—— C 
qui s'obtient en substituant à l'hypothèse et à la conclusion leurs négations. 
Le réciproque du théorème H——>C est le théorème C——>H obtenu en échan- 
geant les rôles de l'hypothèse et de la conclusion. On peut donc associer à 
chaque théorème trois autres théorèmes, par les opérations d'inversion et 
de réciprocation, ce qui fournit le tableau : 


1. Théorème direct ME EE 
25 4 inverse : F— CC 
3 ge réciproque D CE 
4. inverse de la réciproque : C—=H 


L'examen de ce tableau montre qu'il ne contient en réalité que deux 
théorèmes distincts. Nous avons vu en effet que les théorèmes figurant dans 
le tableau sous les numéros 1 et 4 ne sont pas distincts. On remarque alors 
que le théorème n° 2 se déduit du théorème n° 3 exactement comme le théo- 
rèmen° 4 se déduit duthéorèmen° 1.Donc 2et 3 bien que d'énoncés distincts, 
ont la même signification. Le théorème inverse et le théorème réciproque 
sont donc ensemble tous deux vrais ou tous deux faux. Cette concordance, 
que le lecteur pourra vérifier sur les exemples simples qu'il imaginera 
lui-même, explique pourquoi la distinction entre ''inversement!! qui concerne 
le théorème inverse, et ''réciproquement!! qui concerne le théorème réci- 
proque, est si souvent méconnue. On peut se demander alors s'il y a lieu 
de maintenir cette distinction puisqu'on vérifie qu'elle n'a pas d'importance 
quand on en vient à la signification du théorème; nous allons voir que la 
distinction a une portée qui va plus loin qu'une simple nuance de construc- 
tion grammaticale , Quand nous disons qu'il revient au même de considérer 
le théorème direct 


SC 
ou l'inverse de la réciproque 
CAR 
nous ne faisons autre chose que légitimer la démonstration par l'absurde, 
2 : 2 = Tr 
Eneffet, démontrer directement le théorème C—>H n'est autre que démon- 
F : Û 
trer par l'absurde H—C, Si donc, on ne s'intéresse pas à la forme des 
2, . : û EPST 
démonstrations, "inversement! et ''réciproquement'' peuvent être considé- 
2 . : : : ; J, 
rés comme synonymes; siau contraire on étudie la manière dont on conduit 
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la démonstration, la distinction devient importante; elle devient naturelle- 
ment capitale aux yeux des mathématiciens qui n'admettent pas la légitimité 
de la démonstration par l'absurde* pour lesquels par conséquent les pré- 
sentes considérations sont entachées de suspicion.Ces restrictions faites, 
revenons aux deux expressions : 


HG CH 
que nous considérons comme équivalentes. La seconde se déduit en souli- 


gnant les lettres, et les échangeant. Cette opération nous rappelle celle par 
laquelle on passe en algèbre de l'inégalité 


a> b 
à l'inégalité -b> -a 


ce qui nous donne à penser que l'on peut définir des règles d'opération sur 
des symboles tels que H, C, représentant des propositions, et les signes 
—, -, représentant l'implication et la négation, permettant de passer 
d'un énoncé à un autre sans avoir à s'occuper de la signification des lettres, 
de même que dans la suite des transformations algébriques intervenant 
dans la solution d'un problème, on n'a pas besoin d'avoir constamment 
présente à l'esprit la signification des lettres sur lesquelles on opère. 
L'algèbre qui opère sur des symboles tels que H, C, existe effectivement; 
elle consiste à mettre en signes les règles de raisonnement d'Aristote. La 
création de cette algèbre est dûe aux efforts successifs de Leibnitz, Morgan, 
Boole;ce dernier l'ayant portée à la perfection convenant aux applications, 
cette algèbre est maintenant universellement désignée du nom de Boole, 


1.2. - INTERPRETATION, À L'AIDE DE CLASSES, D'UN ENONCE DE 
THEOREME. 


Suivant les règles d'Aristote, un énoncé tel que l'toute fonction dériva- 
ble est continue''n'a de sens que sionla considère comme liant les éléments 
suivants : 


1 - La classe des fonctions 
2 - La classe des fonctions continues 
3 - La classe des fonctions dérivables 


On peut donner une représentation graphique de ces trois classes et 
de leurs relations respectives de la manière suivante : on représente une 
fonction par un point appartenant à un carré T, lequel représente la classe 
des fonctions. Parmi les points du carré T, il en existe qui représentent 
des fonctions continues. Le domaine contenant ces points est représenté 
sous forme d'un cercle C; parmi les points de C, il en est qui représentent 
des fonctions dérivables; le domaine contenant ces points est représenté 
sous forme d'un cercle H, intérieur au cercle C. 


La relation C 
H—>C 


est représentée graphiquement par le fait que 
H est intérieur à C. 


Considérons maintenant les domaines H et 
C extérieurs aux cercles H et C. Nous voyons 


que C est contenu dans H, ce qui concorde avec 
l'expression : DE S;E; 


* Il s'agit des mathématiciens appartenant à l'école dite Intuitioniste, dont le chef 
de file est le mathématicien hollandais BROUWER, de l'Université d'Amsterdam. 
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D'une manière générale, soit dans une totalité T d'éléments quelcon- 
ques une classe À comprenant certains de ces éléments, conformément à 
la figure 2. Cette classe À est constituée par les éléments de T qui possè- 
dent une certaine propriété caractéristique. Ceux des éléments de T qui 
ne possèdent pas cette propriété forment une classe À. 


e 


Si À comprendtous les éléments deT, Aest vide. Nous écrivons alors : 


AY Mme T AUD SAN 

Si À était vide, ce serait A qui serait iden- 

tique à T. Nous écririons alors : + 
AMEN À chEn EN 

N est une classe fictive, le néant, à laquelle 
on égale une classe lorsqu'on veut exprimer 
qu'elle est vide. 

Considérons maintenant deux classes A et fig2 


B, dont les éléments appartiennent à T. En 
général les éléments de T se partagent en quatre classes, à savoir ceux 
qui appartiennent : 


Dre ST ANDRE 
2) 10 As ect ep 
3)2rh0 DNATRESENEE 
AŸ-iire st ct D 


Ces quatre classes sont disjointes, c'est à dire qu'un élément quelconque 
de T ne peut pas appartenir à la fois à deux d'entre elles. Les quatre classes 
considérées sont représentées sur la figure 3. 


1. 3. - OPERATIONS ELEMENTAIRES SUR LES CLASSES, 


Convenons de représenter par A.B les éléments qui appartiennent à la 
fois à A et B. les quatre classes considérées peuvent alors se noter, dans 
l'ordre : 


AB, A:P, A BAD. 


4 
Le point (.) représente l'opération d'inter- és) 


section. Si on considère 3 classes A,B,C, on 
peut former leur intersection, 


On remarque que l'on peut écrire cette 
expression : 


(ea 2 Et © ou encore (A. C) .B fig.3 


sans changer de signification. Il revient en effet au même, soit de considé- 
rer les points communs à A et B, lesquels forment une classe D, et de 
chercher ensuite les points communs à D et à C, ou de commencer par 
chercher les points communs à A et C, et de prendre ensuite l'intersection 
avec B de la classe ainsi fôrmée. Il est donc inutile, lorsque l'on forme 
l'intersection de plusieurs classes, de préciser l'ordre dans lequel on forme 
l'intersection; s'il s'agit de trois classes, les 6 expressions 


AB.C:, À.C.B, B.C,AS B'A.C, GA -B, GBA 


ont exactement la même signification. On peut également grouper deux ou 
plusieurs classes et les remplacer par leur intersection, ce qui s'exprime 
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par exemple par : 
ASE.CAD. = AB .C).D 


On résume les considérations ci-dessus en disant que l'intersection est 
commutative et associative. 


À côté de l'intersection, il est naturel de considérer la réunion de 
plusieurs classes. Représentons par À + Bla classe formée par les éléments 
qui appartiennent à À ou B; cette classe À + B sera appelée réunion de A et 
de B. On peut définir la réunionde plusieurs classes, soit, pour trois classes 


BAM CAC 


La réunion jouit des mêmes propriétés d'associativité et de commutativité 
que l'intersection. 


1. 4. - RELATION D'INCLUSION ENTRE DEUX CLASSES. 


Revenons maintenant à la relation entre classes À et B qui exprime 
que la propriété caractérisant les éléments de À implique que tout élément 
de À appartient à B, ce que nous pouvons écrire : 


(1)  A—>B 


Cette relation entre classes peut s'exprimer d'une autre façon. On voit 
que si À est contenu dans B, AB se confond avec A, d'où l'égalité : 


(2) A.B = A 


Réciproquement (2) entraine (1). Donc (1) et (2) sont deux façons d'écrire 
la même chose, ce qui nous montre que le signe —>n'est pas indispensable 
si on admet l'usage des signes . et =. 


On peut exprimer (1)encore d'une autre manière. Si À est contenu dans 
B, la réunion de B et A est encore B, d'où : 


(3) A+B = B 


On voit facilement que (1), (2), (3) sont équivalentes, ce qui montre 
que le signe—>n'est pas indispensable si on admet l'usage des signes + 
et =. 

Il existe encore d'autres manières d'exprimer (1), en exprimant que 


s 


certaine classe est égale à T ou à N. Si en effet À est contenu dans B, tout 


point de T appartient soit à B, soit à A. D'où : 
(ae :B+A =NT 


Enfin, si À est contenu dans B, il n'existe aucun point qui soit contenu 


à la fois dans A et dans B, d'où : 
(5) AB N 


1,5. - RELATIONS ENTRE OPERATIONS ELEMENTAIRES. 


Nous avons été en présence de 5 manières différentes d'exprimer la 
même situation. Nous allons chercher s'il est possible de passer de l'une 
à l'autre des expressions 2, 3, 4, 5; l'expression (1) restant à part parce 
que ne contenant pas de signe d'égalité. Nous allons pour ce faire étudier 
les propriétés des opérations d'union et d'intersection, combinées entre 
elles et avec l'opération de négation qui consiste à substituer À à A. 


En ce qui concerne la négation, nous voyons tout de suite que la double 
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négation de À ramène à À : 
(6) A = Ua 
Si nous cherchons à combiner l'union et la négation, nous voyons qu'en 
général : 
A+tB # At+B 
On peut même donner pour À + B une expression qui montre que la 


> 


négation n'est pas distributive par rapport à l'addition. Un point qui n'est 
as dans À +B n'est ni dans A ni dans B. Il se trouve donc à la fois dans 
A et B, d'où : 
(7}ee ASF7B 20 AB 
Si nous remarquons que les égalités 
A = DB AMEMLS 
sont équivalentes , ce qui revient à dire que l'on peut nier les deux membres 


d'une égalité sans que cette égalité cesse d'être vraie, nous déduisons, en 
niant les deux membres de (7) et tenant compte de (6) : 


A +B = A.B 
ou encore, en remplaçant A par À et B par B : 
(Sem Aube =18q METEE 


La comparaison de (7)et(8)montre la dualité entre l'union et l'intersection. 
La négation d'une union est l'intersection des négations des termes de 
l'union. 


La négation d'une intersection est l'union des négations des termes de 
l'intersection. 


Ces règles sont connues sous le nom de règle de Morgan. 


Si on remarque : 


N = T Lies ù 
nous voyons que (4) et (5) se déduisent l'une de l'autre en niant iles deux 
termes. Par exemple, à partir de (4), nous obtenons successivement : 

Bi A er TU D Bts tT etats NN 
En combinant les opérations d'union et d'intersection, on obtient 
l'égalité 
(O)UICA" + 5) 46 TA C0) CS IC) 


facile à vérifier, exprimant que l'intersection est distributive par rapport 
à l'union. La relation (9) est tout à fait identique à celle utilisée en algèbre 
ordinaire. Dans le symbolisme que nous sommes en train d'étudier, on 
peut dans (9) échanger le rôle de l'union et de l'intersection, ce qui conduit à : 


COS (AB) LLC EERTAE CherE EE) 
qui exprime que l'union estdistributive par rapport à l'intersection. L'éga- 
lité (10) peut se vérifier directement; on peut également la déduire de (9). 
Ecrivons (9) en remplaçant chaque classe par sa négation, ce qui conduit à 
CH CR BC NAS) RCE) 
Cela est légitime, puisque l'égalité (9) est supposée vraie quelles que 
soient les classes, A, B, C. Nions les deux membres de (11). Nous obtenons 


AMET Bit Crea AMICALE) 
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ou encore 
(AB) f+:CY=, (A FC)". (5 + C) 
ce qui est bien la relation (10). 


1. 6 - RESUME DES REGLES D'OPERATIONS SUR CLASSES. 


Résumons les relations que nous avons obtenues : 


Nous avons défini des opérations + (union) et . (intersection) entre des 
classes. Ces opérations satisfont à : 


À + B = B + A A.B = B.A 
(12) (A+B) + C = A + (B+C) (AB) Ca M'ONbE.E) 
AB). Cr A °C +UbB .C (NB) + C =-(A+C) :. (B+C) 
Ilexiste deux classes particulières, T (totalité) et N (néant) telles que : 
(IS) RAT TE TT A+N = A 
ASC TE = A A ,.N = N 


Il existe une opération, dite négation, qui associe à chaque classe A 
une classe A telle que : 


(14h At X =oT 


A.A = N 
La négation d'une union et la négation d'une intersection satisfont à 
(15) AÀ+FB - A.B A.B = +85 
Enfin les deux égalités 
(16)4 An= B À =,5 


sont équivalentes. 


Les règles (12), (13), (14), (15), (16), que l'on peut vérifier sur des 
exemples, d'après la définition intuitive des opérations +,.,-,ne sont pas 
indépendantes. L'application de la règle (16) permet, comme nous l'avons 
vu, de passer de l'une à l'autre des égalités (14) voir|(7) et (8)] . Elle 
permet également de passer de l'une à l'autre des colonnes dans lesquelles 
sont rangées les relations (12). Elle permet enfin de passer de l'une à l'autre 


des lignes (13). Enfin, appliquée à (14), elle montre que T = N. 


1. 7. - QUELQUES PROBLEMES SUR L'ALGEBRE DES CLASSES. 


Nous ne chercherons pas ici à savoir quel est le nombre minimumdes 
règles (12- 16) suffisantes pour en déduire les autres, renvoyant pour cela 
aux ouvrages spécialisés. Nous les utiliserons de la manière qui semblera 
la plus commode, et commencerons par quelques problèmes simples. 


Problème I. - Démontrer l'inégalité : A = A 
Nous commencerons par résoudre le système : 
(17) A+X = T 
A ,.X = N 


Ce système admet une solution unique. S'il admettait deux solutions 
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X et Y, nous aurions : 


(18) A+Y T 
A .Y = N 
Multiplions la première équation (17) par Y. Nous obtenons : 
À CON EE RATES TT 
d'où, d'après (18) et (13) 
NÉE TL T 
(19) . X AYANT 


Si nous multiplions la première équation (18) par X, nous sommes 
amenés de même à : 


LOC IVIELX 
d'où l'égalité de X et Y. 


Nous savions, d'après (14), que (17) admet la solution A. Nous savons 


maintenant qu'elle est unique . Considérons maintenant À, qui est par défi- 
nition ia solution en Z de : 
A +Z=T AciSZEQUN 


Cette solution est unique. Or A est solution. Donc A=A. 
Problème II. - Démontrer que À + A = A, 


Comme dans le problème I, nous allons procéder par le calcul. Nous 
allons chercher à montrer que la négation de À + À est À; comme une classe 
n'admet qu'une seule négation, d'après ce qui a été vu dans la solution du 
problème I, il en résultera bien que À + A = À. 


Pour que À + À ait pour négation À, il faudrait que 
ASH ARENA ET (AFF ANA = N 


Calculons donc les membres de gauche. Nous avons, par application de 
(14), puis de (13) : 


A + A FA = At (A HA) CMANPIT 267 


En ce qui concerne (A + A) . À, nous développons le produit, ce qui nous 
donne 


(A+A).A=A.A+A.A = N#+N 
et enfin, par application de (13) (où nous faisons A = N) 
NA PENSE ENTE 
Il est bien montré que À est la négation de À + A, d'où : 
A + À = À 
(21) A+A A 
On remarquera qu'en niant les deux membres de : 


À + An = A 
on obtient une relation, analogue à celle que l'on demandait de démontrer, 
à savoir : 


Le 


(22)2 AP À FERA 
Problème III. - On a vu que les deux égalités 
(23) ARS AR B°7= ‘AB 
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étaient équivalentes. Peut-on le montrer par le calcul ? Ajoutons B aux 
deux membres de la première. Nous obtenons : 


ACHBE- MAR PB EE 
Nous pouvons remplacer, dans le second membre, B par 
Bts BUS A FA) SA PHASE 
ce qui nous conduit à 
Bis PB+TA B+rA,.B=A,B+A.B=: (A+A).B=8B.T=E 


Pour déduire la première égalité de la seconde, il suffit de multiplier les 
deux membres de la seconde par À, ce qui donne : 


RD OA CA PB) PEUT ARE ANPBTISMAMA R = A. Ti À. B 
MR INT PB) = À. L'e A 


Les problèmes résolus ci-dessus montrent le parti que l'on peut tirer 
du calcul des classes. Nous n'avons pas encore étudié complètement la 
relation 


AB 


Nous mettons cette étude à part, parce que, étant données A et B, les 
expressions À, À +B, À . B représentent des classes, mais l'expression 
A——>B ne représente pas une classe, mais bien une relation entre classes, 
ou si l'on veut, une équation à laquelle satisfont À et B. Nous avons vu que 


l'on pouvait mettre cette relation sous l'une des formes 
A = À .-B BU= "A TB 
Deux autres formes intéressantes sont : 
CAN AT BE=UT 
(2524 .,B = N 


la plus intéressante des deux étant la seconde, qui se présente d'une façon 
analogue aux équations de l'algèbre, f (x, y) = ©, puisque A . B est une 
fonction de A et B, et que N joue un rôle tout à fait comparable à celui du 
zéro. Pour montrer que (24)et (25) sont équivalentes à A—>B, remarquons 
tout d'abord qu'elles sont équivalentes entre elles; en effet, la seconde 
s'obtient en niant les deux membres de la première, et réciproquement. 
Si maintenant nous multiplions les deux membres de (24) par A, nous 


obtenons : 
Né A seByz Az T 
c'est à dire À ,. B = A 


ou encore A ——>B 

Supposons maintenant-que À . B = A. Nous en déduisons : 
RnB ul BAT = MA BA A) EMA HUAFA Bit Tut A: BL=iT 
c'est à dire (24). Nous constatons bien l'équivalence de (24), ou (25)avec 


A——>B 


Si nous réservons le signe = à des égalités entre classes et si nous 
employons le signe = pour lier des relations entre classes, qui ont même 
signification, nous obtenons par exemple : 


(A—=B) = (A+B.= T) = (A.B = N) 


A côté des opérations fondamentales -, ., +, onintroduit souvent l'opération 
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représentée par C, définie par 
(26) PACE ATPE 


À C Best une classe, au contraire de A—>B qui est une relation entre 
classes. On voit que par définition on a l'équivalence : 


(27) { (AC .5) = T} = A—8 


Nous allons établir, à titre d'exercice, une proposition importante 
concernant cette opération € 


Problème IV. - On considère trois classes quelconques À, B, C. 
Quelle est la classe définie par læ formule : 


(28) [ (AIRE) à (Bcc) | CHA CC) 
Nous nous reporterons à la définition (26); nous obtenons 
(AScaB)  (B CC) ENTAN D). (B+'CM= A BEA: Gr €e 
en négligeant d'écrire le terme en B . B, qui est égal à N. 
L'expression à calculer s'écrit alors : 
AB ANICHB CH AMHC = "4 5) .(AsC) (BAC) 
= (A+B).(A+C)(B+C)+A+cC 
Nous développons les deux premières parenthèses : 
(AT B)(A NC) HAPATTT TA Bb. CAFE LC 
Nous avons utilisé, pour simplifier le résultat, le fait que, quel que soit X 
ARRATE SE EAT N TE CT IANEET EN AE 0 (TE TE) ARR A 
Multiplions par la troisième parenthèse. Il nous revient : 
ABEB CB ErA, Cube CC. EU A UT +A CD AT 
L'expression à calculer devient ainsi : 
(29) GA.18 HA. CrHBir'C As hG 


Sous cette forme, cette expression est assez difficile à interpréter. Calcu- 
lons sa négation. Nous obtenons : 


(A +B) (A +C)(B +C) A .C 


Le produit par A de la première parenthèse est À B. Le produit de AB par 
la deuxième parenthèse est ABC. Le produit de ABC par Cest N. 


Donc l'expression (29) est égale à T. Nous obtenons ainsi : 
(30) [ (A cB) k (Bcc)| (acc)} = T 
et cela, quelles que soient les classes A, B, C. 


Pour calculer (29), nous sommes passés à la négation, parce que les 


simplifications y sont presque automatiques; nous aurions pu opérer direc- 
tement, en observant que puisque : 


A =-A+AGAIC 
nous pouvons ajouter À . C à (29). Nous observons alors l'existence dans 
(29) des termes 
An. CO + A , C+rC = (ARE GE GRR Ce D 
ce qui suffit pour montrer que (29) a pour valeur T. 


Le résultat obtenu est intéressant, parce qu'il montre que certaines 
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expressions en À, B, C, ...ne dépendent pas en réalité des classes A, 
B, C, ...bien que cela ne soit pas évident à première vue. Il est également 
intéressant si on revient à l'équivalence 

CARE CRE { (A CB) = T) 


Nous allons montrer que l'égalité (30) est en relation étroite avec la 
proposition 


Si AB et B—>C, alors A—>cC 


ce qui signifie simplement que si À est contenu dans B et B dans C, alors 
À est contenu dans C. Ceci peut s'écrire, en utilisant le signe & pour lier 
par ‘'et'' deux relations entre classes, et le signe — pour indiquer qu'une 
relation entre classes entraine une autre relation : 


(31) (A—>B)&(B—>C) > (A—>0C) 


On remarquera l'analogie formelle entre (28) et (31), bien que la signi- 
fication soit différente, naiss dans (31) il s'agit de relations entre ''rela- 
tions entre classes'', tandis qu'en(28)il s'agit seulement d'une classe for- 
mée à partir de A, B,C par des opérations +, ., - (l'opération C étant une 
opération attiliaite) Cette analogie formelle explique pourquoi on peut 
déduire (31) de (30).(30) est une égalité vraie quelles que soient A, B, C. 
| Haquese maintenant que A—> B et B—> C. Puisque A—> B, nous avons 

ATICEE 


Puisque B—>C, nous avons (B CC) = T.Donc, le crochet qui figure 
au premier membre “ (30) est T.T = T. Nous obtenons ainsi 


ÎT C (acc)} CRT 
ce qui signifie que 
T—=> (ACC) 


La classe À CCne peut contenir T que si elle est elle-même égale à T. 
Donc 


(ACC) = JF 


ce qui signifie que A—>C. Nous constatons que (31) est-bien une conséquence 
de {30). Comme nous n'avons pas pour but principal de faire de la logique 
formelle , nous nous en tiendrons là pour la comparaison entre (30) et (31). 
. nous allons plutôt majntenant nous occuper de techniques de calcul. Le 
passage de (28) à (29) est assez aisé; mais le calcul de (29) peut sembler 
artificiel. Il serait regrettable que pour montrer que deux expressions en 
A,B,C,...A, B, C, ..., écrites sous des aspects différents, sont en 
réalité identiques , onne puisse se fier qu'à la plus ou moins grande habileté 
avec laquelle onfait des groupements de termes .Nous allons voir qu'iln'en 
est pas ainsi, et que l'on peut donner pour les expressions en À, B,C, 
des formes canoniques , telles que si deux expressions, quoique de formes 
primitives différentes, sont équivalentes , elles se ramènent toujours à des 
formes canoniques identiques . Nous expliquerons la formation de ces formes 
sur le cas de 3 classes A, B, C, la généralisation étant évidente. 


1. 8. - FORMES CANONIQUES D'UNE EXPRESSION DEPENDANT DE 
PLUSIEURS CLASSES. 
Considérons le cas où les classes figurant dans une expression sont 
au nombre de trois, soient les classes À, B, C. Les classes A, B, C 
partagent la classe T en 2 = 8 classes 


PE CAD .C  À.B.C. ,Ab.C. PARC. AaD:0 CAD iQ 2: 
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que nous appellerons K,, K,, ..., K,. Considérons les classes de la forme 


8 
(ir AE CES 0% D 
i=i 


le signe = représentant l'union des classes sous le signe Z , étant entendu | 
que l'on ne conserve que les classes pour lesquelles £; = 1.Sipar exemple | 


la suite des € est 
IR OSOM TORTUES 
nous obtenons la classe : 
A.B.C + A.B.C + A.B.C + A.B.C 


Les expressions de la forme (1) sont dites formes canoniques disjonc- 
tives , comme se présentant sous la forme d'une union de classes disjointes 
(sans points communs). Ilnous faut montrer quetoute expression F (A, B,C) 
formée à partir des classes A, B, C par l'utilisation des signes +, ., - peut 
se mettre sous la forme (1). 


Remarquons que siF, et F, sont deux expressions que l'on sait mettre 
sous forme canonique 


ER ni F, = EtiK; 


1 [l 
F, +F, se mettra sous forme canonique 


(ape Fe FRMEME(E HE EN )R GEr ER 


En effet, F, +F, s'obtient en faisant l'union de tous les K, figurant || 


dans l'une ou l'autre des formes F,, F,, c'est à dire que t;'' ne doitêtre | 


nul que si ft; et €; sont tous deux nuls; sil'un ou l'autre des termes E£; ,£;' est 
égal à un, £;'' doit être égal à un; c'est bien le cas pour la forme 


11 = t ! 
2 = + £; - £é; 
Nous aurions de même 


(SLUMENMENESRES EME 


1 2 
puisque seules figurent dans F, F, les K; pour lesquels on a à la fois 


Fort nl Eu) 
Nous voyons donc que sides expressions quelconques sont données sous 
forme canonique , nous pouvons mettre sous forme canonique les expressions 
; RER ; S à 
qui s'en déduisent par les opérations +, ., -. Il reste à montrer simplement 
que A, B, C elles-mêmes peuvent se mettre sous forme canonique. Cela 


est immédiat, puisque 


AREAS NEMIONEANMIDINCERAMOET ACE PATATE C 


BE PAF" SCAN IBIMNCEE AS EB MC ANRB TIC 
CRE, PB LC AS Bi CHA PB GAP AG 


Une remarque est cependant nécessaire.dans le cas où la suite des €: 
serait : 


OMOPFONCEOMOMONC 


comme nous convenons de ne pas écrire les classes K; pour lesquelles €; = 
O, ilne nous reste rien à écrire. Donc à proprement parler, une expression 
de la forme F (A,B, C) qui toutes réductions faites se ramène àN,ne peut 


€; = €! = 1. Enfin nous aurons : 1 
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pas se :nettre sous forme canonique disjonctive. Au contraire, une expres- 
sion qui se réduit à T peut se mettre sous forme canonique, à savoir la 
somme des huit classes A, B.C., ...., À. B.C. 


Ilest évident que la forme canonique dis jonctive est unique, nous avons 
donc un moyen sûr pour savoir sideuxexpressions F (A, B, C), G (A, B, C) 
sont ou non identiques bien que primitivement d'aspect différent. 


Il existe une autre forme canonique, dite conjonctive , d'un usage moins 
courant. Considérons les classes : 


(4) A+B+cC A+B+C A+B+cC A+B+C 
A+B+C A+B+C A+B+cC A+B+C 


Toute expressionen A, B, C peut se mettre sous la forme d'une intersection 
de classes de la forme ci-dessus. Soit en effet F une pareille expression. 
Mettons F sous forme disjonctive, soit 


PAPER KR 
nous en déduisons 
FE MMRERAR. 


K,,R,,R, étant de la forme (3). En effet, les termes de la suite (4) ne sont 
autres que les négations destermes employés dans la forme disjonctive. On 
marquera qu'ence qui concerne la forme conjonctive, c'est T qui représente 
le cas d'exception, tandis que N peut s'exprimer : 


Ne Spip 


1. 9.- NOMBRE DE FONCTIONS DISTINCTES DEPENDANT DE n 
CLASSES. 


Une expressiontelle que F (A,, A,, ..., AÀ,) formée à partir des classes 
A,, À,, À, par les opérations +, ., - s'appelle une fonction booléienne des 
Blasses A, A}, A, .la considération des formes canoniques permet d'évaluer 
le nombre de fonctions booléiennes distinctes que l'on peut former, fonctions 
de n classes. Considérons le cas simple où n = 2, et soient À et B les deux 
classes dont on cherche à former une fonction. Les termes de la forme 
canonique sont ici au nombre de 4 : 


A .0B A.B À 12 A.B 
Dans la forme canonique, chacun de ces termes peut figurer ou non, ce 
qui nous donne 2 = 16 possibilités. Il y a donc 16 fonctions distinctes de A 


et B. Mais nous notons que parmi ces fonctions, ily en a 2, à savoir T et 
N, obtenues en prenant 4 ou 0 termes, qui ne dépendent pas de A et B. Il y 
en a 4 qui ne dépendent que de À ou de B, à savoir À, À, B, B. Par exemple 
A s'obtient par le choix 


PARA RNA PR HARCE 


Il nous reste donc 10 fonctions seulement dépendant de A et B ; ce sont 
les fonctions LA Mrs Phil 
A.B A . B ATX BD A .B A8, FRE ASE 
et les fonctions qui s'en déduisent par négation, ce qui fait bien 10 fonctions 
en tout. 


Pour mettre une expression sous forme canonique disjonctive, on 
applique les règles : 


a +8 
Le 


SI al 


il 
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jusqu'à ce que les signes - ne s'appliquent plus qu'à des classes À, B, C, ... 
On a alors une expression ressemblant à une expression algébrique, dans | 
laquelle les lettres A, B,C,..., A, B, C, ... sont combinées uniquement 
avec les signes + et . On développe cette expression d'après les règles de | 
l'algèbre ordinaire (puisque l'intersection est distributive par rapport à | 
l'union) comme si l'union était une somme et l'intersection un produit. On | 
réduit les termes semblables d'après la règle : 
A+A = A A.A = N 

et on obtient ainsi une somme de termes, On met ces termes sous forme | 
canonique en écrivant par exemple : < 

AM B VEUARC DB ACTA BEC | 
et on réduit à nouveau les termes semblables. On est alors parvenu à la | 
forme canonique. | 


Soit, par exemple, à étudier si l'opération C est associative, c'est à | 
dire s'il y a identité entre les expressions 


(ACB)CC | 

A1 C4(B:C-G) | 

Nous mettons la première sous forme canonique, ce qui donne : | 

(AT B)CC = 0(A +) CCum at DihGtés AAC | 
= ABC+ABCGC+ABC+ABC+ABC 


La seconde peut s'écrire : 
A+(BCC)= A+B+C=ABC+ABC+ABC+ABC+ABC+ABC+ABC | 
Nous voyons que les deux expressions ne sont pas identiques, et que l'on a : 
FAN de) Ep A Ve OO er a og oc | 

= [ (ACB) Cc] +A+FB | 

On peut vérifier que : 


[ (ac) cc]c[a cscc)]) = T 


En effet, le premier membre de l'équation s'écrit : 


ABCtA. + B,4+C.-z A 5.40 + À +BiHCi= (A + BNC LAB EC 
= A+B+C+BC 


Comme A ne figure qu'une fois, mettons : 


B+C+BC 
sous forme canonique par rapport aux variables B et C. Nous obtenons : 
BC MB'C + B CF B CO FROM SM DICEPB'OH IEC PET ERIET 


On arrive plus vite au résultat en niant l'expression, ce qui conduit à 


BG BC. =. B . C(B4C) . = /N 


s 


Le fait que l'opération C n'est pas associative oblige à utiliser des paren- 
thèses lorsque plusieurs de ces opérations se succèdent, pour qu'il n'y aït 
pas d'ambiguïté. 


Le lecteur doit maintenant être en mesure de traiter un problèmetel 
que le suivant : 
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Problème V. - Etant données deux classes À et B, on définit l'opéra- 
tion n par l'égalité : 
ARMES PESTE DE ANSRMERANARE VE 
Calculer l'expression : 
Gael einer 


comparer ce problème au problème IV, et essayer de tirer des conclusions 
analogues. Chercher en particulier la règle qui joue par rapport à l'expres- 
sion (5) le rôle joué par la règle (31) relativement à l'expression (28). 


Problème VI. - Montrer que le nombre de fonctions booléiennes dis- 
tinctes, de n classes A, » À,, À,, dépendant effectivement de chacune des n 
classes est : 


N(n)-TN(n-1)+ GUN (n- 2) + 


formule où l'on a posé pour abréger l'écriture 


NN) = 07 


1. 10. - NOMBRE MAXIMUM DE SIGNES D'OPERATIONS NECESSAIRES 
POUR EXPRIMER UNE FONCTION DE n CLASSES. 


Il est intéressant pour les applications, de savoir quel est le nombre 
maximum de signes d'opération qui interviennent dans la formation d'une 
fonction booléienne à n variables. Pour les comptes, remarquons qu'il ya 
2" termes possibles dans la forme canonique disjonctive, et que chacun de 
cestermes contientn - 1 signes. On prend un certain nombre de ces termes. 
Toutes réductions faites, il en reste au plus 2", Soient en effet A DIT CO ee 00 
L'lesnclasses,etK;, K,, ..., les termes en nombre 2 ©, correspondant 
à toutes les classes considérées sauf L.Nous aurons alors, pour les termes 
correspondant à À, B, C, ... L, les termes des deux lignes. 

K,L, K,L, KL, 

KE, KR I, 
Chacune de ces lignes contient 2"' termes. Sila fonction booléienne consi- 
dérée contient plus de 2"! termes il y aura forcément, dans les termes qui 
y figurent, des termes dans une même colonne, qui se simplifieront d'après 
le schéma 


Lt KL = K, - 
Comme ilya He colonnes, il reste 2x termes au plus. Nous avons 
doncauplus (n -]1) 25 signes, et au plus 2 signes +, d'où n2 = 1 signes 


+ et .;il nous reste maintenant à nous occuper des signes de négation; Soit 
F la fonction considérée, dans laquelle figurent au plus n2" lettres, et 
soient Le ; ' les nombres de négations figurant dans F et F. La fonction 
F +F = T, mise sous forme canonique disjonctive non simplifiée, contient 
n2" lettres, c'est à dire n 2°" signes de négation. Les simplifications ame- 
nant à F et F ne peuvent que faire disparaitre un certain nombre de signes 
de négation, d'où be + u' <n2 .Ilen résulte que l'on a : 


pen2 ou M = ne 
; : > £ n-2 
les deux inégalités pouvant avoir lieu simultanément. Si pÆ£n 2H, 2TOUS 
voyons que F peut s'écrire avec au plus : 
ANR Der. Msjne2" 1] 
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signes d'opération. Si > n 2"?, nous aurons 
p£én2"*-1 
et par conséquent F pourra s'écrire avec 
3 hr27 "02 
signes d'opération, ce qui permet, avec une négation supplémentaire, 
d'écrire F avec au plus 3m2"? -] signes d'opérations. 


Nous obtenons ainsi le résultat : une fonction booléienne à n variables | 
peut toujours être écrite de manière à faire intervenir au plus des signes 
d'opérations en nombre égal à 


ÉD M à 
étant entendu que les signes d'opération sont les signes d'union, d'intersec- 


tion et denégation. Pour n = 3, ce nombre est de 17. Il se trouve effective- 
ment dans la fonction 


Fe = AB C+FABCTABC+FA BC 
et également dans la fonction F | 
F - (ABCDHABCHABC+ABC | 


Toute autre fonction de A, B, C peut s'écrire avec moins de 17 signes | 
d'opérations. Naturellement, le décompte est fait sur laformule développée, 
mais on peut s'arranger pour que le nombre des opérations soit moindre. 
Nous pouvons par exemple écrire : | 


F = (AB+AB)C+(AB+2AB)C 


I1 n'intervient dans cette expression que 10 opérations, comme le 
montre le schéma ci-dessous : 


A AB AB + AB 


chaque opération est représentée par un petit carré contenant le signe de 
l'opération. On voit qu'il ne figure que 10 petits carrés dans le schéma. 


2. ALGÈBRE BINAIRE DE BOOLE 


2. 1. - PROPRIETES DES FONCTIONS CARACTERISTIQUES DE CLASSES 


À toute classe À, contenue dans une totalité T, on peut associer une 
fonction dite l'caractéristique'', de la forme 


d(k)n = KA: x) 
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où x désigne un élément quelconque de T, et jouissant de la propriété que 
si x appartient à A, a (x)= 1 et si x appartient à A, a (x) = O0. a (x) est ainsi 
une fonction numérique, qui ne peut prendre que les valeurs 0 et 1. 


Considérons maintenant deux classes A et B. Nous avons évidemment 
KR CArB,: x) = RAA) MER EE) 


La fonction caractéristique attachée à À . B peut donc être sans inconvénient 
représentée par a (x).b (x), a(x)etb(x) étant les fonctions caractéristiques 
attachées à A et B, et le signe . représentant le produit au sens ordinaire. 


Appelons maintenant a (x) + b (x) la fonction caractéristique attachée à 
À +B. Nous avons par définition a (x) + b (x) = K (A +B ; x). 

On vérifie sans peine que : 

RAD x) = KA Sx)+K(B:x)-K(A.B ;x) 
d'où ; 
a (x) +b(x) =  a(x) +b (x) - a (x) b (x) 
Nous voyons ainsi la relation entre l'algèbre de Boole et l'algèbre ordinaire: 
l'algèbre de Boole concerne l'ensemble des propriétés des expressions que 
l'on peut former à partir des nombres a, b, c, ... par les opérations de 
produit et d'union, le produit étant le produit classique, et l'unionétant 
définie par 
(1) a+b = a +b -ab 
A ces deux opérations, il faut ajouter la négation, définie par : 
; (ANNEE 1-a 


Il est essentiel de remarquer que le produit et les opérations (1) et 
(2), appliquées à des nombres égaux à 0 ou 1, donne encore des nombres 
égaux à 0 ou 1. Il suffit pour le montrer de partir du fait qu'être égal à 0 
ou 1, pour un nombre t, se traduit par : 


tie out 
Supposons donc : 
ere D ep 
Nous en déduisons : 
(rhbleu=trentpiuteibit2jabstré bs2 ab! 
= a +b - ab = a +b 
(ab) = be: Ab 
(l=a} ET Ml 2raiens <e 1 


L'algèbre de Boole, opérant sur des nombres égaux à 0 ou 1, c'est à 
dire dans le système de numérotation binaire, sera dite algèbre de Boole 
binaire. 

Il peut être utile, en certaines circonstances, de ramener Pesbie 
binaire de Boole à l'algèbre ordinaire, c'est à dire aux relations mod (Rx); 
mais onsuivraen général le chemininverse, parce que l'algèbre mod (x? -x) 
n'est pas très commode à manipuler . Supposons par exemple que nous soyons 
en face du problème suivant : 


Problème VII. - Quels sont les polynomes z en x et y tels que si : 
ee 3 Z y? = y 


Ms satistont à-z = 7? 
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La solution algébrique est la suivante : 
Puisque x? = x, y? = y, z peut toujours, quel que soit son degré, se 
ramener à : 
Z u À + Bx + Cy + Dxy 
d'où 
2 = À +Rx +C'y+Dx y +2 AB x +2 Acy +2 AD x y + 2 BCxy 
1P BD x°y +2 CD xy° 


SRE Pa AB) PC Po'AC) y (D + 2 AD P2BC F0) BD F2ICD 


Les coefficients À, B, C, D doivent ainsi satisfaire à : 
2 


A = A | 
BU -0UE(B+24) | 
@ = CUCH2MA) | 
D'1 2e Men 2 tu Br ChRAPIBE | 
Ce système ne se résout simplement que si on pose : | 
B = À ERA C = HR D = Ÿ +A-XÀ -H 
ce qui conduit à : 
ME A EX psp v=v 
Si on ordonne z en A,À, v, on voit que l'on obtient : 
2 den AI -x) (L=y)+ kx(l-y) tp y 0. =x) € » xy 


ce qui montre que nous avons en fait écrit la forme canonique disjonctive : 
Z = AXY + À XY + LLYX + V xy 


Si on prend comme point de départ l'algèbre de Boole, on obtient tout de 
suite l'expression générale de z dépendant de quatre paramètres tous égaux 
ADO an 


Posons maintenant un autre problème. 


Problème VIII. - z ayant la forme générale établie à propos du problè- 
me précédent, quelle doit être sa forme pour que z = 1, six = y et dans ce 
cas seulement ? 


Ici le calcul direct peut se faire directement. Si x # y, on a : 
(x ) = 1 
Nous essayons donc : 
Z = 1 -(x Ar ° 


qui convient effectivement. On obtient en développant : 
Z = SS S A 2 sr 


Si nous voulons utiliser les résultats que nous connaissons déja en | 
algèbre de Boole, nous pouvons partir des équivalences : 


{ A = B } = (A—>B) . (B—>A) | 
AR | EE TR 1) 
ce qui nous permet d'écrire l'égalité À = B sous la forme : 


(A +B).(A+B) =  T ou encore AB LAC RNRSSRTE 
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ee appelant x et y les fonctions caractéristiques de A et B, nous obtenons 
ien : 


Z = xy + (1 -x) (1 -y) = 1-x-y + 2 xy 


2. 2. - EQUATIONS BOOLEIENNES. 


Considérons l'équation en x et y 
> MARS = 2 xy 
qui d'après ce que nous avons vu, est équivalente à : 
ue NUE à 
On peut chercher à résoudre cette équation en y. Nous tirons effectivement : 
Ve aix 
Elevons cette expression au carré, nous obtenons : 
EE LUE 
d'où 
SN" 


Parallèlement à cette résolution, nous pouvons chercher à résoudre en B 
l'équation 


ARBÉFA DB MS AT 
Il suffit pour cela de multiplier par A et par B, ce qui donne 
AVRE = A ASIE = B 
d'où A = B. Inversement, À = B satisfait à l'équation, qui se réduit, si 


A=B,à A+tA=T. 


Il se pose donc le problème général de résoudre une équation de la 


forme 
MÉCONNZ, 24) Ver N 


où F est une fonction booléienne des classes X, Y, Z, 
Une telle équation sera appelée équation booléienne. 


Si F est mise sous forme canonique disjonctive, nous pouvons en grou- 
pant les termes qui contiennent À et ceux qui contiennent A, mettre F sous 


la forme fi 
F = AX + BX 


À et B étant deux fonctions booléiennes de Y, Z, ... 


Raisonnons en algèbre binaire de Boole, ce qui nous conduit à l'équa- 


tion : 
(DU ax br m0 


dans laquelle a, b,x sont des variables booléiennes . Les quatres variables : 
ab, ab, äb, äb, 


sont telles que l'une d'entre elles, et une seule, est nécessairement égale 
à 1. Nous avons pour les quatre cas possibles : 


Si ab = 1 ax + bx = 1 
Siab = 1 ax +DX "= 7% 
Si äb = 1 ax + bx = x 
Si 3b = 1 ax + bx = (0) 
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x doit donc être égale à 0 dans le deuxième cas, à 1 dans le troisième; dans 
le premier et quatrième cas, x est indéterminée, puisque ax + bx a alors 
une valeur indépendante de x. Ceci nous donne ainsi la valeur de x : 


x =  abu +0.ab+äb+aä.b.v =  abu + äb + äbv 
u et v étant arbitraires; x étant ainsi définie, on voit que : 
abx + äb + äbx = X 
ce qui permet de mettre la solution, en x, de l'équation (1) sous la forme : 
(2) x =  äb+(ab + 3b) x 
En portant cette valeur dans (1), il reste la condition 
G)BAabDE = 0 


Nous vérifions que si ab = 1 ou ä.b = 1, l'équation (2) laisse x indéter- 


minée, Si ab = 1 l'équation n'est pas vérifiée, si a.b. = 1, elle l'est, si? 


äb + ab = 1, xestentièrement déterminée, puisque l'on a x = äb, et l'équa- 
tion est satisfaite. 


Si nous avons maintenant une équation à plusieurs inconnues, soit : 


LR, vi 2) = 0 
on peut la résoudre en posant : 
El z) Sea O2) 
1(0% y, 2) IE 2 EyAz) 
ce qui nous ramène à : 
x = àä(y;z)b(y,z)+ ay, z)b(y, z) + à (y, z) b (y, 2) 
a (y, z)b (y,z) =Ug(y,"z) = 0 


On opérerait ensuite sur g comme sur f. 
D'une manière générale, une équation de la forme 
Dee ACTE) = 0 


se résoudra sous la forme 


RE TR (RERO Pa) 
PSE (SR SPLRREE ) 
ET ETES ET) 

x 2010) 


Si la dernière équation est de la forme Xn= 0, x, = 1 ou x, = x,, l'équa- 
tion admet une ou plusieurs solutions. Si elle est de la forme Xn= X,,l'équa- 
tion est impossible, ù 


Toute équation de la forme f = 1, se ramène immédiatement au cas 
étudié en posant g = 1 -f. Tout système de la forme 


EF, CPU ne dE 70 
se ramène à l'équation unique : 
FE, AIPHÉENMNRRE = 0 
Problème IX. - Montrer que le système 
KE CRVECNZ 


est impossible, 
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Commençons par exprimer que x & y. Si y = 1, x est indéterminée; 
Bi y N0), x 1=00; d'où 


Le LU (L=y)r.s su y 
Nous en déduisons par multiplication par y que 
x = XY 
ou encore 
(Liv) = () 

Nous savons par ailleurs que x = y s'exprime par 

See) (EE yIEs à 1 
La condition x # y s'exprimera donc par 

xy PLx) fly) En 220 


La condition x < y, qui comprend à la fois x < y et x # y, devient 
ainsi : 


x (1 -y) +xy +(1-x) (1-y) =, 0 
De même y < z donne 
SE ZE Vrar (l sy) (es) LE, 0 
Le système proposé se ramène à l'équation unique : 
f(x, y,z) = x(1-y) +xy + (1-x) (1-y) +y (1-2) + yz + (1-y) (1-z) =. 0 
Nous obtenons, après des simplifications évidentes : 
f(x, y,z) = x+y(1-y) [(-x) + (1 -2)] 


=  x+y +y (x +2) 


Pour x = 0, cette expression est égale à 1. Pour x = 1, elle est encore 
égale à 1. Donc le système est impossible. 


Nous pouvons remarquer que x € y équivaut à x = 0 y = 1. 


En effet, x < y s'exprime par 


VC REV = 0 
La méthode générale nous conduit à écrire : 
MATE IV) = 0 

d'où 

a = 1 b = y 

Y = 0 

>< = Y X 
ce qui donne bien x = 0, y = 1. 


Après ces exercices sur les variables booléiennes numériques, nous 
allons revenir aux classes. Nous obtenons des résultats tout à fait compa- 
rables;si par exemple nous avons 


ACHAD: Ko 2 N 
nous en déduisons que : 
A B = N 
pe A B+X(AB + A.B). 
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De même, nous pouvons résoudre des équations de la forme f (Xe 2e 
N.Ilnous faut cependant faire une restriction quant aux inégalités telles que 
X < Y, quand il n'est pas vrai que X = Y. En effet, dire que l'on n'a pas 
X = Y, ou encore que l'on n'a pas 


XY + XY 


D 
ne signifie pas ici que l'on a 


NOV ON N 


Il 


2. 3. - OPERATION DE SCHAEFFER. 


On peut exprimer toutes les opérations sur variables booléiennes à 


partir des opérations +, ., - Schaeffer a montré qu'une seule opération 
suffirait, à savoir la contradiction, définie par 
A|B = AB 
On voit facilement en effet que 
AN ha NE 
et que 
AB mes<eprp (fs (A 18) |(A18). 


Comme l'union s'exprime à partir de l'intersection et de la négation, 
elle peut donc s'exprimer en fonction de la contradiction seule, Examinons 
les opérations possédant les mêmes propriétés que la fonction de Schaeñffer, 
ce qui nous conduit au problème suivant, que nous traitons en algèbre de 
Boole binaire. 


Problème X. - Quelles sont les fonctions booléiennes de deux variables 
telles que l'on puisse, en utilisant uniquement une de ces fonctions, expri- 
mer toutes les autres ? 


Nous savons déja que la fonction de Schaeffer 
FC, y) = 1 - xy 


permet d'exprimer toutes les fonctions booléiennes . Considérons maintenant 
la fonction la plus générale de deux variables 


(DRE (y). = mxy + Bx (1 -y) +Y (1 -x) y +06 (1 -x) (1 -y). 


La négation de x ne peut se définir que par F (x, x); nous devons donc 
avoir : 


(Ce) MU 1x 
d'où 
ER =N T0 ô = 1 
La fonction prend donc la forme 
(2)n F(rsyhs =, 28 x (1 -y) +7 (Lx) y E(L-x) (4 -y) 
Si p AU, y est forcément égal à 0, sinon nous aurions 
Fox, y) = (-x)y+{(1-x)!(1-y) = 1-x 


et F ne dépendrait que de x. De même si B = 1, on a nécessairement Te 1 
Nous n'avons donc en définitive qu'à choisir entre 

fx, y) =  (1-x)y+(1-x)y+(1-x) (1-y =  1-xy 

gx, y) =  (1-x) (1 -y) 
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c'est-à-dire entre la fonction de Schaeffer et la fonction : 
g (x, y) = x Fy = 1-f(1-x, 1 -y) 


Les deux seules solutions au problème proposé sont donc les fonctions 


f (, y) F XY 
gx, y) = ° xFy 
3.- TREILLIS 


3.1.-DEFINITION IMPLICITE DE L'UNION A PARTIR DE L'INCLUSION. 


Nous allons, relativement aux classes, étudier un problème qui trouve 
son prolongement dans l'algèbre générale. Nous allons voir si on peut définir 
la somme X + Y à partir du produit et de l'implication. Partons de X et Y. 
Nous pouvons former les trois classes 


XY > ER > 4 n'a 
Combinons encore ces classes par produitetimplication. Nous obtenons 
DORE) RE VEN ECET) EE CV TV) RO ET)  SOVET 
POSER ONE pue RNA YTE Qu, RY PX AVR = MX + 
TR Re nat cn tit te un og 22€ Ÿ 


Sinous poursuivons les combinaisons , nous voyons que nous ne sortons 
pas du système de classes 


DRSCNT, SCA ENT ESC VS NC NT CE Y 


Donc, nous ne pouvons obtenir X + Y par une opération explicite; 
cherchons une définition implicite. 


Il est bien évident que X + Y est une classe Z contenant X + Y, et que 
toute classe contenant X et Y contient Z. Z est ainsi définie par 


X — Z ViswiZ, 
EE CR MOUTON NON 


Ceci nous donne les équations 


Rare dr 
VOL AUEENN GR 
ROUEN IE E 1 

lesquelles s'expriment uniquement en utilisant . et C puisqu'on peut les 
Écrire: 

SA) = T 

(LC = 

{[æcu.«cu]c cu} = T 
Voyons ce que donne le développement de ces équations : nous obtenons 
Fe Sn 2 = 41 
V2: Un svt 
(X +U) (Y+U)+(Z+U) = T 
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ou encore 


XZ SUN 
DA = N 
(CF U) (RU) ZU nn sSEUPN 
La dernière équation donne 
LYZU = N 


Cette équation doit avoir lieu quel que soit U. D'où, en rassemblant 
toutes les conditions en une seule : 


KZ FYZFXIZ = N 
c'est à dire 
XYZ +(X +2Z)7Z = N 
Nous obtenons ainsi : 
(X + Y) Z = N 
(XF Y)Z = N 
d'où 
7 = ZX ET) 
Z = Z (X + Y) 
La négation de la deuxième relation nous donne 
7 = LATE CETEN 
En combinant les deux équations 
2 = ZAEX ET) 
7, = Zénr KGar M 


nous obtenons la valeur cherchée de Z. Il suffit pour cela, dans le second 
membre de la seconde, de remplacer Z par Z (X + Y), ce qui donne 


Z = Z(K+Y)+X+Y = X+Y 


On montrerait de même que l'intersection de X et Y peut se définir 
comme la classe Z telle que 


LES Z—Y 
Si U— X et U—Y, alors U—=7Z 


3. 2. - ENSEMBLES PARTIELLEMENT ORDONNES. 


La conception des opérations + et . à partir de l'inclusion nous amène 
à dire quelques mots des treillis. D'une façon générale, on appelle ensem- 
ble partiellement ordonné, un ensemble d'éléments tels qu'entre certains 
couples d'éléments, on puisse reconnaitre si existe, ou non, une relation 
de la forme 


a < b 
Cette relation est supposée transitive, c'est à dire que 
a < b et b<c 
entraine a < c. L'inégalité stricte 


at QD 
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signifie que a £ b et que a est distinct de b. L'inégalité stricte est disy- 
métrique, de sorte que l'on ne peut pas avoir à la fois 


A CMbréte ee D 


Lorsque l'on a a < b, on dit quelquefois que b est un ascendant de a, 
et que a est un descendant de b. Sion considère les humains du point de vue 
de la filiation, ils constituent un ensemble partiellement ordonné. En effet, 
étant donnés deux individus a et b, trois cas peuvent se présenter, et trois 
seulement : 


a est descendant de b 
b est descendant de a 


a et b ne sont pas liés en ligne directe, 


De même les entiers vus du point de vue de la divisibilité forment un 
ensemble partiellement ordonné : étant donné deux entiers a etb, iln'ya 
que trois cas possibles : ou a divise b, ou b divise a, ou a et b nese divisent 
ni dans un sens, ni dans l'autre. On peut dire la même chose pour les 
polynomes. 


Examinons le cas des entiers. Nous exprimerons, pour éviter toute 
confusion avec les inégalités usuelles, la relation a divise b par a—b. 
L'arithmétique nous apprend alors que, si on se donne a et b, il existe 
parmi leurs ascendants communs (leurs multiples communs) un ascendant 
tel qu'il soit descendant de tous les autres ascendants communs. En signes, 
cela veut dire qu'il existe c tel que 


a =,c 
b—>c 
si(a—=>d) et (b —>d) alors (c —> d). 


De même, parmi leurs descendants communs, il existe un descendant 
qui est un ascendant de tous les autres descendants; ou encore, il existe Y 
tel que 
res 
Va b 
si (ô—>a) et (dÔ —>b) alors (0 se Ye 
On reconnait là le plus petit commun multiple et le plus grand commun 
diviseur; nous voyons que dans l'algèbre de Boole, AB joue le rôle d'un 
plus grand commun diviseur, À + B le rôle d'un plus petit commun multi- 
ple. Représentons pour uninstant par a +b le p.p.c.m. et par ab le p.g.c ‘d”. 
de deux entiers. Cherchons si les relations de l'algèbre de Boole ont lieu. 
Examinons par exemple l'égalité 


a (b+c) & ab +ac 
Au premier membre figure le p.g.c.d. de a et du p.p.c.m. de betc; 
au second membre figure le p.p.c.m. des p.g.c.d. de a et b d'une part, 


de a et c d'autre part. Exprimons ces différents nombres. En appelant A 
le p.g.c.d. de a, b, c, nous avons (en écrivant des égalités ordinaires) 


a & A œ 
b = A 
e — AY 
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wc, PB ,Y étant premiers entre eux dans leur ensemble. Appelons ô, à 6, les. 
p.g.c.d. dewet f, de &«etY. Nous aurons alors 


a = Aë,w = Aô,w” 
ba à = 10 A0. 
Can à 7 dt nor Vie 


x' et B’ sont premiers entre eux, ainsi que &”et Y’6,et 6, sont premiers 
entre eux, puisque &,f ,ÿ n'ont aucun diviseur commun; puisque 0, w 
ô,w”,6, divise w”. 


L » 
Si nous faisons intervenir maintenant le p.g.c.d. ô, de p et Ÿ” nous 
obtenons 


a = À 6,6,X 
b = A ô,ô,pe 
c 2 A 6, 6, 
Dans ces conditions nous avons 
ab = À 6, 
ac = À 6, 
ab +ac = A 6,6, 
HIFCRC = A 6, 6, 6, y 
a = A 6,6, 
abc) À 6,6, = ab +ac 
Examinons également l'égalité 
a + bc = (a +b) (a + oc) 
Nous aurons 
bc = A 6, 
a +bc = À Ô, 6, 6, À 
a +b Æ A", 6, 6, 
a +c = À 6, 6, 6, XV 
(a +b) (a + c) = a +bc 


Nous voyons que les relations de l'algèbre de Boole sont valables pour 
les opérations +(p.p.c.m.)et.(p.g.c.d.). On peut en donner une justifica- 
tion élémentaire en remarquant qu'étant donnés 
ab, c,-s1i on calcule leur p.p.C.m.,.et qu'on 
décompose ce p.p.c.m.enfacteurs premiers, 
et qu'on marque sur un jeton chacun de ces fac- 
teurs, on peut disposer ces jetons sur une table 
de manière que chaque nombre soit représenté 
par l'ensemble des jetons disposés dans un 
* cercle, les opérations dep.g.c.d. et p.p.c.m. 
étant alors exactement des intersections et des 
unions. Par exemple, le produit des nombres 
contenus dans le petit triangle du milieu n'est 
autremquetlelp.2.c.d. dera, Dr. 


3,3 2 DEPRINIMON" DUUNAIR PTE LIS\ 


On conçoit l'intérêt qu'il y a à savoir si un ensemble partiellement 
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ordonné se prête ou non à des calculs semblables à ceux que nous avons 
étudiés à propos de l'algèbre de Boole. 


La première question est de savoir si a +b et ab existent. Pour un 
ensemble dont on suppose seulement qu'il est partiellement ordonné, a +b 
et ab n'existent pas nécessairement, ce qui veut dire que parmi les ascen- 
dants communs à a et b,iln'en existe pas forcément un qui est descendant 
de tous les autres. Par exemple dans l'ensemble des quatre éléments a, 
b, c, d tels que l'on ait seulement 


A—>c a —4 
b— c b — d 


a +b n'existe pas; ab défini comme le descendant commun de a et de b tels 
que tous les autres descendants communs soient ses descendants, n'existe 
pas davantage pour l'ensemble considéré. 


Les ensembles partiellement ordonnés tels que pour tout couple a, b 
les éléments a + b et ab existent sont appelés des treillis. 


Allons plus loin. Soit un treillis. L'égalité 
a (b+c) = ab + ac 


peut, ou non, avoir lieu. Dans le premier cas, le treillis est dit distributif. 
Lorsque le treillis n'est pas distributif, on peut montrer que l'on a une rela- 
tion moins stricte, à savoir : 


ab +ac—>a (b +c) 
et que l'on a également 
a +bc—>{(a +b) (a +c) 
On remarque tout d'abord que 
ab— b—b +c ab —> a 
ac—æœc—b+c ac —> a 


ab et ac sont donc deux descendants communs à a et à b + c. Par définition 
a (b + c) admet pour ascendants tous les descendants communs. Donc 


ab +tac—>a (b +c) 
En général, dans un treillis, seules sont vérifiées les lois de ‘'semi 
distributivité'! 
ab +ac—>a (b+c) 
a +bc—>(a +b) (a +c) 
dont nous avons démontré la première; la seconde se démontre d'une ma- 
nière analogue. 


De toutes manières, les opérations + et - sont associatives et commu- 
tatives. Si enfin une des lois de semi distributivité est une loi de distribu- 
tivité complète, il en est de même pour l'autre. Si, par exemple 


a (b + c) = ab + ac 
nous aurons 
(a +b) (a +c) = a + ab + ac + bc = a +bc 
puisque l'on a évidemment a +ab = a. 


Donnons, pour fixer les idées, un exemple de treillis dans lequel a 
simplement lieu la semi distributivité. Il suffit pour cela de considérer des 
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domaines convexes. Etant donnés deux domaines convexes À et B, la défi- 
nition de AB, c'est 
à dire le plus grand 
des domaines con- 
vexes contenus à la 
fois dans AetB, se 
confond avec l'in- 
tersectionordinai- 
re.Mais la défini- 
tion de À + B, c'est 
à dire le plus petit 
des domaines con- 
vexes contenant à 
la fois A et B, est 
différente. 


On vérifie fa- 
cilement sur la fi- 
gure la propriété 
de semi distributi- 
vité; AB + AC est 
cerclé d'un trait gras; sur la figure A(B+C) est confondu avec A. L'inéga- 
lité est évidente. 


3. 4. - TREILLIS DISTRIBUTIF. 


Portons maintenant notre attention sur les treillis distributifs. Pour 
faire le raccordement avec l'algèbre de Boole, il ne nous manque plus que 
la négation. Bornons nous aux treillis contenant un nombre fini d'éléments, 
soient : 


dj; Aps ++. An 
Posons 


JE = ANA TEE NAr 


N = dj a, ... à). 
T et N sont deux éléments du treillis. T est ascendant d'un élément quel- 
conque, N descendant d'un élément quelconque. Nous avons évidemment, 


quel que soit a 
1 ne ab Aro À = a 


a . N = N a+N = a 


Nous reconnaissons là des relations fondamentales de l'algèbre des 
classes. Soit maintenant à définir à. Nous le définirons implicitement 
comme racine du système 


a +x = 1F ax = N 


En se rapportant aux raisonnements en 1-7 faits pour montrer que À = 
A, on montre facilement que si x existe, x est unique. Mais x n'existe pas 
forcément. Considérons le treillis constitué par 3 éléments a b c tels que : 


A —> bb —0c 


Ce treillis est distributif, comme on le vérifie sans peine. Nous avons 
évidemment 


a = N c = 4e 
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b, s'il existait, satisferait à 
b +x = CE bx — a 
On voit que le système n'a pas de solution. 


Les treillis distributifs pour lesquels on peutassocier à chaque élément 
a un élément 3 sont dits treillis à complémentation. Les règles de calcul 
dans de pareils treillis sont identiques à celles de l'algèbre de Boole. 


4- COMPARAISON DE L’ALGÈBRE DE BOOLE 
AVEC L’ALGÈBRE ORDINAIRE 


Après avoir montré les relations de l'Algèbre de Boole avec la théorie 
des inégalités, par l'intermédiaire des treillis, nous allons maintenant faire 
une comparaison avec l'Algèbre ordinaire. Nous désignerons par a, b, c, 
... des éléments qui seront des nombres en algèbre, des classes en algè- 
bre de Boole. L'union sera représentée par +, le produit par . . Les clas- 
ses Net T seront représentées par 0 et 1. Les règles communes aux deux 
algèbres sont : 


a +D 


il 
[ox 
+ 
p 

p 

(op 

il 

(os 

[) 


bic a (Disc) Gb) Ca scCrb ac 


(@] 
st 
FR 

w 


(a +b)+c = a + (b 
a + 0 - a a+ À ES a 
Dans l'algèbre de Boole, le système 
ATX = 1 EE = 0 


admet toujours une solution, tandis que dans l'algèbre ordinaire iln'en 
admet que si a = 0 ou a = 1. Cette solution est représentée par a. 


Les opérations suivantes sont légitimes en algèbre de Boole et ne le 
sont pas en algèbre ordinaire : 


a+boe = (a +b) (a +c) 
a + ab = a 
a (a +b) = à 
ab = a +b 
a +b — 24. 4 


Ilexisteen Algèbre ordinaire des opérations qui ne sont pas légitimes 
en Algèbre de Boole. Si 


SE 1e 
on peut en déduire, dans les deux algèbres, que 
a +x = ACTA 

a = a y 


mais tandis que le retour inverse est permis en algèbre ordinaire (sauf 
pour la deuxième équation si a = 0), il n'en est pas ainsi en algèbre de 
Boole, On ne peut pas, en algèbre de Boole, simplifier les deux membres 
d'une égalité. Celatient à ce que, dans cette algèbre de Boole, les équations 
(considérées séparément) 

0 


1 


a+x 


FLN TS, 
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n'ont pas de solutions. 


Les différences citées ci-dessus suffisent à mettre en évidence les 
précautions à prendre quand on calcule en algèbre de Boole. Le lecteur 
pourra s'exercer à chercher d'autres points de comparaison tels que 
celui-ci. 


Si en algèbre ordinaire 
arc = 0 


entraine que l'un au moins des facteurs est égal à 0, en algèbre de Boole, 
l'égalité 
abc = 1 


entraine que tous les facteurs sont égaux à 1. 


5.- APPLICATIONS DE L’ALGÈBRE DE BOOLE 


5, 1. - APPLICATIONS AU CALCUL BINAIRE. 


Considérons deux nombres binaires x, et y,, égaux chacun à 0 ou I. 
Leur somme est un nombre binaire à deux chiffres au plus, de la forme 
(z,, Z,). z, n'est égal à 1 que si x, et y, sont égaux tous les deuxà 1, auquel 
cas leur somme est z = (1, O0). 


Nous avons ainsi 


2 = X1 Yi 
2 Zi) = x, ET) 
d'où 
Z; = AR AE OT 
En notation booléienne, ceci donne 
2; F X, Y, FX, 
Z Æ AD: 


Soit maintenant à faire la somme de 3 nombres x,, y,, t,, égaux à 0 ou 1. 
Faisons d'abord la somme de x,, y,, ce qui nous donne (z,, zZ,). Le résultat 
final de l'opération sera ainsi un nombre (s,, s,), avec 


s, = Z, & +2 tt, 
Sy = Énzi uIz; 


Dans s,, nous voyons apparaitre le report t, z, et l'ancien report z,.Ils ne 
peuvent pas être égaux à 1 tous les deux, puisque 


Un Er = 0 
Nous avons ainsi sous forme canonique 
5 à XNU +R VE +x ytax ÿt, 
8, : Le VIN EVE Le Vi cb AV Là 


s, est.égal à 1 seulement si au moins deux des variables x, y, t, sont égales 
à 1 ce qui conduit à la forme 


(1) S, = X M tyt txt, 
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Si s, = 1, nous avons 


8 = X, Yi ti 
Si s, = 0, nous avons 
É + Xi ty tt 
d'où 
(2) «ss, = SR dat Sa Hviaett) 


Si nous disposons d'appareils faisant la somme (+)et le produit et la néga- 
tion, nous pourrons donc faire l'opération conformément au schéma. 


>< 

4 opération + 
or-gate 

4 (or-gate) 

t Sy 

t 

4 opération . 
(and-gate) 

».< 

4 

t 8, 

X 

4 

(4 


L'avantage de ce schéma est de comporter une seule négation, ce qui est 
important dans le calcul électronique, lorsque l est représenté par la pré- 
sence d'un signal, et 0 par son absence. Nier la présence est facile (on 
court circuite) mais nier l'absence (il faut amener de l'énergie) peut l'être 
moins. 


Une fois construite une cellule additionnant trois chiffres, il est facile 
de construire un dispositif additionnant deux nombres quelconques, puisque 
l'on peut faire les reports. Le schéma ci-dessous, où x, y sont les chiffres 
à additionner, t les chiffres de retenue, s les chiffres de la somme, se 
passe de commentaires. 


L'intérêt de l'algèbre de Boole par le calcul électronique est que les 
réseaux à diodes fournissent tout naturellement les opérations + (ou) et 
. (et). Les problèmes à traiter sontalors par exemple de chercher la forme 
des fonctions booléiennes contenant le moins de signes d'opérations, ou 
contenant le moindre nombre de négations. 
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5. 2. - APPLICATIONS À LA LOGIQUE. 


L'algèbre de Boole se prête particulièrement à l'étude de la logique 
formelle, puisque si on interprète le signe + comme ‘'ou'' et le signe . 
comme !l'et'!, on trouve une correspondance entre T (vrai) et N (faux), qui 
permet de ramener à un calcul algébrique un grand nombre de considéra- 
tions sur la structure logique des raisonnements. 


Si par exemple a (x, y) est une fonction d'éléments quelconques, égale 
à 1 si les éléments satisfont à une condition A (x, y), égale à 0 dans le cas 
contraire, une proposition telle que : 


(&w) ‘Pour tout x s'il existe un y tel que A" 
s'écrit 
Le a (x, y) = 1 
le signe È jouant par rapport à + le rôle de À par rapport à +. 
On peut comparer à (w) la proposition (B) : 
(B) ‘Il existe un y tel que pour tout x on ait A!" 


laquelle s'écrit 
7e a (x, y) = 1 
La proposition (B) entraine forcément (x). D'où l'inégalité 
ga Es le pue (25) 


Cette inégalité est une règle de logique. 


Pour certaines formes de a (x, y), on a 
TE a (x; y) L Zralx, y). 


. De tels raisonnements permettent de voir par exemple la relation 
logique qui existe entre continuité simple et continuité uniforme. 


5, 3. - LOGIQUE INTUITIONNISTE. 
Nous avons vu le rôle fondamental joué dans l'algèbre de Boole par la 
relation 
a +b = ag D 


qui suppose l'existence de la négation. Si on cherche à faire une logique 
plus générale que la logique classique on peut, au lieu de se rattacher à des 
treillis distributifs avec complémentation (qui équivalent à l'algèbre de 
Boole), s'en tenir à des treillis distributifs. On ne définira pas ä comme 
la solution du système 


a +x = ET 


ax = N 


mais comme le plus grand x satisfaisant 


s 
à 
dx = N. 
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à est ainsi défini par 
ENNES = N 
(a . x = N) implique (x—>3a). 


Cet 3 existe bien; il suffit pour le former de considérer tous les x; satis- 
faisant à 


et de poser 


Considérons maintenant à, défini par 
ANA ON 
(&ä . x = N) implique (x—>3), 


Si dans la dernière relation nous remplaçons x par a, nous obtenons, au lieu 
He a = 3,-la relation 


dd 


Passons maintenant à He Nous avons encore 


FRE à 
et 
Sue EN 
Par ailleurs, puisque a—3. 
D Me à 
Donc 3 .4 = à. 2 = N 


Nous en déduisons , en remplaçant x par 3 dans la condition définissant a, que 
i— à 
Rapprochée de 3—+ 3, ceci nous conduit à 


a = 


ill 


Si donc la double négation n'équivaut à l'affirmation, la triple néga- 
tion équivaut à la négation simple. Il n'y a pas là de paradoxe. Si en effet 
nous interprètons änonpas comme a est faux mais comme a est démontra- 
ble faux, nous voyons que la correspondance entre.a, a et à est la suivante : 


démontrable vrai démontrable faux démontrable vrai 


démontrable faux démontrable vrai démontrable faux 


impossible à démontrer démontrable faux | démontrable vrai 


faux ni vrai 


Nous voyons que a opte a, au sens que si a est démontrable vrai, 
à l'est aussi, mais que à n ‘implique pas a .a de son côté se révèle, si on 
prolonge le tableau, identique à & parce que toute proposition de la forme 
ä ne peut jamais se trouver dans le cas douteux. 
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Ce type de logique, dite logique intuitionniste, repousse le raisonnement 
par l'absurde. A l'usage, la tâche de construire des démonstrations direc- 
tes, sans recours à l'absurde, s'est révélée si formidable qu'aucun traité 
systématique sur ces bases n'a été mené à bien, ce qui n'empêche que la 
question de la légitimité du raisonnement par l'absurde reste toujours 
actuelle, 
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CHAPITRE PREMIER 


INTRODUCTION ALGÉBRIQUE 


1. NOTION DE NOMBRE 


Au fur et à mesure du développement des mathématiques, on a observé 
une évolution de la notion de nombre, dans un sens de généralisation crois- 
sante. 


Au début, nous trouvons les nombres dits''naturels'', qui sont un, deux, 
trois, etc ... sans le zéro. Pour de pareils nombres, on sait définir 
l'additionet la multiplication, opérations toujours possibles. On sait définir 
aussi la soustraction et la division, avec ou sans reste, opérations quine 
sont pas toujours possibles. Etant donnés deux nombres a et b, il existe 
donc toujours des nombres x et y tels que : 


ATX 
ab = 4 Y 
mais il n'existe pas toujours un nombre z tel que 
a =. b+2z 
Si un tel nombre existe, on a a >» b, et on écrit conventionnellement 
Z = a -b. 
Si a } b, il existe toujours un nombre q tel que 
Bras CID +1) 
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ce nombre, quiestle quotient avec reste, n'est appelé quotient exact que si 
a = bq 


et on écrit alors conventionnellement 


2. NOMBRES ENTIERS 


Les généralisations dela notion de nombre sont intervenues pour ren- 
dre possibles des opérations quine l'étaient pas . Dans l'algèbre des entiers, 
qui sont les nombres formant la suite, infinie dans les deux sens : 


Fe ce 2 Sale 0 les 


on sait définir l'addition, la multiplication; la soustraction est toujours 
possible, puisque, quels que soient a et b, il existe toujours un nombre x 
tel que 


a = b+x 
L'écriture 

x = a -b 
a donc toujours un sens. 


La division sans reste continue à ne pas être toujours possible; cen'est 
qu'exceptionnellement que à a et b on peut associer un nombre q tel que 


a =  bq 


3. NOMBRES RATIONNELS 


: È a ; 
Pour donner à l'écriture D Un sens quels que soient a et b, on passe 
; . ; s a : 
des entiers aux nombres rationnels, ou fractionnaires. b * alors toujours 
un sens, sauf si b=0. Les quatres opérations sont alors toujours possibles. 


Les opérations impossibles dans l'algèbre des nombres rationnels sont 
les résolutions d'équations algébriques. Par exemple, l'équation 
x? = 2 
n'est satisfaite par aucun nombre rationnel, et le symbole V2 est donc 
dépourvu de sens dans l'algèbre des nombres rationnels. Seules ont un sen: 
ses valeurs approchées,. 


4- NOMBRES RÉELS 


On est alors conduit à faire une théorie générale des valeurs appro- 
chées, qui peut se résumer comme suit : 


Savoir calculer une valeur approchée d'un symbole, c'est savoir dé- 
terminer, pour un nombre rationnel quelconque, s'il est valeur approchés 
par défaut, ou par excès. C'est donc savoir associer à tout nombre rationne 
r, sauf peut-être un, une valeur f (r), égale à 0 sir est une valeur appro: 
chée par défaut, à 1 si r est une valeur approchée par excès.f (r) est ains 
fonction, de valeur égale à 0 ou à 1, telle que si r' € r'!' on a forcémen 
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f(r') < £(r''), puisque toute valeur plus petite qu'une valeur approchée par 
défaut est elle-même par défaut, et toute valeur plus grande qu'une valeur 
approchée par excès est elle-même par excès. f (r) doit être définie pour 
tous les nombres rationnels sauf peut-être un parce que si le symbole définit 
un nombre rationnel r,, r, lui-même n'est approché ni par défaut, ni par 
excès, puisque c'est la valeur exacte. Si f (r) est définie pour tous les nom- 
bres rationnels, le symbole dont f (r) définit les valeurs approchées ne 
peut être un nombre rationnel. On dit alors qu'il représente un nombre 
irrationnel. Les nombres rationnels et irrationnels, dont l'ensemble cons- 
titue les nombres réels, ne sont donc autres du point de vue théorique que 
des séparations entre valeurs approchées par défaut et par excès. 


5. NOMBRES COMPLEXES 


Les nombres réels permettent les quatre opérations fondamentales; 
ils permettent l'extraction d'une racine carrée, ou d'une racine d'ordre 
multiple. Dans l'algèbre des nombres réels, toute équation de la forme : 

6) ON) 


où f (x) est une fonction continue, admet une racine dès que l'ona pu trouver 
deux nombres a et b tels que f (a) . f(b) { 0.Enparticulier , toute équation 
algébrique de degré impair admet au moins une racine réelle. Mais il existe 
des équations très simples, telles que 

x +0, pO 


qui n'admettent pas de racine. On est amené alors à introduire pour la 
généralité des énoncés la notion de nombre complexe, c'est-à-dire de 
nombres x + yi, sur lesquels les opérations sont les mêmes que sur les 
nombres réels, avec la restriction que i? = -l. Dans ces conditions, toute 
équation algèbrique de degré n admet exactement n racines. 


6.- NOMBRES HYPERCOMPLEXES 


La généralisation se poursuit maintenant en observant qu'un nombre 
complexe x + yi avec la règle 


RS 
apparait comme un cas particulier d'une expression 
= x ARR x; 1e... Xi) 
x, ., Xn étant des nombres réels, et les (7e étant des symboles obéissant 
à des règles d'opération de la forme 
= Lx (a); x (m) réels 
(m) st m st 


De telles expressions sont appelées nombres hypercomplexes. On peut 
montrer alors que si on considère les deux règles : 


26 14 


R, Commutativité de la multiplication : 
Va, Er à YX 
R Inexistence de diviseurs de zéro : 


2 
Si Xy = 0, alors x = 0 ou Y = 0 
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mises à part parmi les règles bien connues de l'algèbre des nombres com- 
plexes ordinaires, onobtient, selon laoules règles auxquelles on renonce, 
les généralisations qui suivent. 


7. QUATERNIONS 


Si on renonce à R, et à R, seulement, on montre que les nombres 
hypercomplexes ont forcément quatre unités hypercomplexes, c'est-à-dire 
sont de la forme : 

q A RE pe te EE 
et que l'on peut, par des changements d'unités convenables n'affectant pas 
la généralité, les mettre sous la forme : 


D RATE VIE EZ KR 


a, X, y, Zz, étant réels, i, j, k obéissant aux règles 


Ces nombres sont les quaternions de Hamilton; leur emploi est assez 
limité. 
Dans les opérations sur quaternions, on a en général : da, 4, É da, 4 
mais si 
ds demo 
on a forcément soit q, = 0, soit q, = 0. 


8.- MATRICES 


Pour augmenter au delà de quatre le nombre des unités hypercomplexes, 
il faut renoncer à R,. On montre alors que les unités hypercomplexes peu- 
vent se mettre sous la forme i4, c'est-à-dire qu'on peut les affecter de 
deux indices, de manière que les règles d'opération soient : 


(4) ist Liv * Ce : Îsv 


Ôtu étant l'indice de Kronecker, c'est-à-dire un nombre égal à lsit=u, à 
0,sit { u. Un nombre hypercomplexe est alors une expression de la forme 


(5) q à L st st 
On voit que si on procède au produit de (5) et d'un nombre 
î - : : = - 
q = » Ct ist» on obtient qq! = L (CHE EN 
avec 
Se HORS Ê 8h Pht 


Au lieu d'écrire q sous la forme (5), on peut l'écrire sous la forme 


PRINCIPES D'ANALYSE MATRICIELLE 145 


qui se prête mieux aux applications . Untel tableau est appelé une matrice; 
l'algèbre hypercomplexe la plus générale (à un nombre fini d'unités hyper - 
complexes) est ainsi l'algèbre de ces tableaux, que l'on appelle l'algèbre 
matricielle. Lorsque l'on traite de l'algèbre matricielle directement sur 
des expressions telles que (5), avec les règles (4), on parle alors d'algèbre 
matricielle totale. 


CHAPITRE II 


NOTATIONS VECTORIELLES ET MATRICIELLES 


Nous aurons à manipuler des symboles mathématiques disposés en 
tableaux rectangulaires, le plus souvent carrés. Les symboles d'un tableau 
rectangulaires à m lignes et n colonnes seront affectés de deux indices, le 
premier indiquant le rang de la ligne, le second le rang de la colonne dans 
laquelle figure le symbole considéré. Le tableau lui-même sera appelé une 
matrice à m ligneset n colonnes, ou, plus brièvement, une matrice (m, n): 
Un pareil tableau sera encadré de crochets, conformément au schéma 
suivant : 


a a ae &n 

2 22 as &2n 
(1) : Nr RS 

2m m2 ee 3mn 


Un pareil tableau sera souvent représenté par une seule lettre majus- 
cule; pour rappeler la nature des éléments qui y figurent, nous écrivons 
l'élément général entre deux crochets, comme suit : 


ee 45 


Les deux indices figurant en bas à droite rappellent qu'il s'agit de m 
lignes et n colonnes. Quand aucune confusion ne sera possible, ces deux 
indices seront omis. 


I1nous arrivera souvent de considérer des tableaux réduits à une seule 
ligne où à une seule colonne, tels que les tableaux suivants : 


(3) K = x, UE [u, u, +++] 


Dans ce cas nous affecterons chaque élément d'un seul indice. Nous 
utiliserons alors les notations abrégées : 


CON LE: MO de 1 
Nous aurons à considérer des sommes et des produits de tableaux, la 
justification des définitions apparaissant par la suite. 


La somme de deux tableaux A et B n'a de sens que si ces tableaux ont 
même nombre de lignes et même nombre de colonnes; c'est le tableau obtenu 
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en faisant la somme des éléments occupant les mêmes emplacements dans 
À et B. Par conséquent, si 


ptet) NÉE Bx = Cb;,] Ca Le] 


(m, n) fur n) (m, n) 


l'équation 
(4) CC = A+B 


signifie que 


pour toutes les valeurs de indices i et j. 


Le produit de deux tableaux A et B pris dans cet ordre n'a de sens que 
si le nombre de colonnes de À est égal au nombre de lignes de B. 


Cette conditionest facile à se mettre en mémoire si l'on observe qu'en 
écrivant que À est une matrice (m, n) et B une matrice (n, p), on voit 
apparaitre la suite ! 


(m, n) X (n, p) 


où le second nombre de la première parenthèse est égal au premier nombre 
de la seconde. Cette condition préliminaire étant supposée respectée, le 
produit AB est une matrice (m, p) dont l'élément général Ciÿj à pour 
expression 


n 
(6) Mi 2. 8h Ph} 
La formule (6) est tout à fait fondamentale, et doit être tout à fait 
familière. On observera que ci s'obtient en faisant la somme de tous les 
produits a; b};,, le premier indice de a; étant le premier indice de Cÿ , le 
second indice de bh; étant le second indice de ci; , le second indice de a jh 
étant le premier indice de b;,;; c'est par rapport à ce troisième indice que 
nous opérons la sommation. On observera également que la formule(é) 
suppose essentiellement que le second indice de ai peut prendre autant de 
valeurs que le premier indice de bij, ce qui revient à dire que A a autant 
de colonnes que B a de lignes. On dit quelquefois que Cij est le produit de 
la ième ligne de A par la j ième colonne de B. 


Le produit de deux matrices dépend essentiellement de leur ordre. 
ABesten général différent de BA; il se peut que AB existe et que BA n'existe 
pas. 


Ilestbonde sefamiliariser avec les produits de matrices particulières. 
Soient par exemple les deux matrices : 


RENE ET CO CCS EE 


qui sont des matrices (n, 1) et (1, n). 
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UX et XU ont toutes deux un sens, mais sont tout à fait différentes, 
UX est une matrice (1, 1), réduite par conséquent à un seul élément : 
(8) UX = lux, + ü, x... tu,u, 
Au contraire, XU est une matrice (n, n), donc une matrice carrée 


X, Uu, x, U xX, U 


1 1 2 1 n 
(9) X, U, X, U Lau 
Xn U Xn Snien 


Nous voyons que les conventions précédentes nous obligent à certaines 
précautions lorsque nous avons à faire l'opération pourtant simple de mul- 
tiplier tous les éléments d'une matrice par un même nombre. Soit en effet 
À cenombre.Ence quiconcerneles matrices (7), nous pourrons considérer 
À comme une matrice (1, 1), ce qui nous conduira à : 


X,À 
x, À 


(10) XX = AU 
X, À 


ru, AREAS xu| 


On observera l'emplacement du facteur À , qui se met à droite de X, et 
à gauche de U. Cette conventionn'est pas essentielle; on ne doit s'y astrein- 
dre que dans les recherches tout à fait théoriques. 


En ce qui concerne une matrice (m, n), ilest impossible de multiplier 
tous les éléments de cette matrice par À en respectant les règles posées 
ci-dessus. Pour pouvoir faire cette opération correctement, il faut faire 
intervenir l'indice de Kronecker, quiestunnombre di , à deux indices, qui 
a pour valeur 0 lorsque les indices sont différents, et 1 lorsque les indices 
sont égaux. Une matrice dont les éléments sont des indices de Kronecker 
sera dite une matrice unité, et représentée par la lettre E. 


Une matrice rectangulaire unité sera donc telle que 


Eole efèn #5) 


Une telle matrice jouit, lorsqu'elle est carrée, de la propriété de laisser 
toute matrice inchangée par multiplication. Soit en effet, une matrice A(m, n); 
formons le produit 


Pas 0), D 0 min (fe) 


Nous aurons 
PUS Ë ip Oh 


Dans la sommation par rapport à h, seul intervient le Ôh; à indices 
égaux, donc b; jilen résulte que 1 
ij &ih 
On arriverait à la même conclusion en considérant le produit : 


(m, m) À (m,n) 
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On voit facilement que pour changer A = a. en À a > 1l faut 
multiplier À par la matrice NG; | ,» à droite ou à gauche indifféremment. 
Quand nous écrivons donc 

RAD = AN = [ray] a 


il ne faudra pas perdre de vue que dans ces équations, À est une notation 


abrégée pour la matrice [8] En eu ani selon que À est 
à gauche ou à droite de A. 


Si cette convention est bien comprise, la notation abrégée ne présente 
aucun inconvénient. 


CHAPITRE Ill 


RÉDUCTION DES MATRICES - RANG 


1 RAPPEL DES RÈGLES D’OPÉRATIONS RELATIVES AUX MATRICES 


Nous rappelons qu'étant données deux matrices (m, n), soient A et B, 
on sait définir leur somme À + B, et qu'étant données deux matrices, 
(m, n)(n, p), on sait définir leur produit AB, qui est une matrice (m, p). 
On sait par ailleurs définir le produit d'une matrice par un scalaire. 


On vérifie sans peine les règles suivantes : 


X(A+B) = XA+XB 

CHAMP BIS M'CPAMPIGFE 
(1) (AB) CA = MA CHERE 

(A B)C SON SANCENE] 


Nous retrouverons les règles usuelles de l'algèbre, sauf la commuta- 
tivité du produit. 


On peut se demander quels sont les éléments qui jouent le rôle du zéro 
et de l'unité. Une matrice N (m, n) sera dite nulle si, quelle que soit A 
(ni se) on a 
(2) A+N = N+A = A 
Une telle matrice N a forcément tous ses éléments égaux à zéro. 
De même, nous définirons une matrice unité E par la condition que 
multipliée par A, elle donne encore À comme résultat de la multiplication. 


Si & . une matrice (m, n), nous devrons avoir, quelle que soit la matrice 
A (n,p 


(3) E À = A 


Mais le produit EA est une matrice (m, p). Ilne peut être égal à À que 
sim =n. Une matrice unité est donc forcément une matricecarrée. L'équa- 
tion (3), si nous posons 


E TZ e— A = ae 
| 1e | i| m,n 


n 
Lei ah} 


s'écrit 


S 
p 
ll 


i h 
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Les équations (4) devant avoir lieu identiquement par rapport aux ai; » 
nous en déduisons 


(5) e ; = bi (indice de Kronecker) 
Quelles que soient les matrices A et B, nous aurons alors : 
EA = A BE FE 


L'introduction de la matrice unité (1) va nous permettre de définir 
l'inverse d'une matrice A, comme étant une matrice qui, multipliée par À, 
donne une matrice unité. 


2. PROPRIÉTÉS GÉNÉRALES DES MATRICES INVERSES 


Soit donnée une matrice A (m,n). Comme le produit n'est pas commu- 
tatif, nous serons amenés à distinguer une inverse droite B et une inverse 


gauche C telles que 


(6) NB E | CAES TE 


m, m) (n, n) 


Supposons que B et C existent toutes deux, B ne peut être qu'une ma- 
trice (n, m), C une matrice (n, m). D'après la propriété d'associativité 
du produit nous voyons que 


(CAIIBE— C (AB) 
En comparant à (6), nous obtenons 
Fn,n) Pn,m) ° (n,m) F(m, m) 
d'où Bis Me : 


Il apparait ainsi que lorsqu'une matrice admet une inverse droite et 
une inverse gauche, ces deuxinverses sont identiques. Il en résulte évidem- 
ment que la matrice inverse est unique. 


Nous donnerons une place particulière à ces matrices qui admettent 
une inverse droite et une inverse gauche, cette inverse étant d'ailleurs la 
même et unique; nous les appellerons matrices non singulières. Unema- 
trice singulière, conformément à cette définition : 


ou bien n'admettra pas d'inverse droite 

ou bien n'admettra pas d'inverse gauche 

ou bien n'admettra pas d'inverse du tout. 

L'inverse d'une matrice non singulière À sera représentée par la 
notation A, 


Supposons que À, et A, admettent chacune une inverse droite, soient 
B, et B, ces inverses. Nous constatons que 


ANA, "BB, = E 
Donc le produit A, À, admet comme inverse droite le produit B, B,. 


Si A, et A, admettaient les inverses gauches C, et C,, le produit À, À, 
admettrait C, C, comme inverse gauche. 


(1) Nous avions déja vu que toute matrice carrée de la forme (5) laissait invariante 


joute autre matrice par multiplication; il restait à montrer, ce que nous avons fait, la 


réciproque. 
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D'une manière générale, on voit que si À,, A, admettent les 


inverses droites B,, B,, ... B,,le produit À, A, ... A, ‘admettra l'inverse 
droite B, B,., ... B,; une DopeniLion analogue aura lieu pour les inverses 
gauches! 

Il résulte de ce qui précède que la condition nécessaire et suffisante 
pour que le produit de n matrices A,, À, ..., À, soit une matrice singu- 
lière est que l'une au moins des matrices A à A ... AN soit singulière. 


Cette proposition est la correspondante de la DrGpositions La condition 
nécessaire et suffisante pour qu'un produit de nombres soit nul est que 
l'un au moins des facteurs du produit soit nul. 


La proposition :''Siun produit de matrices est nul, l'une au moins des 
matrices constituant le produit est nulle'', est une proposition fausse. 


Nous ailons maintenant démontrer la proposition fondamentale : 


Une matrice non singulière est forcément une matrice carrée. La dé- 
monstration sera basée sur la remarque évidente : si on multiplie une 
matrice À par une matrice B non singulière, on obtient une matrice AB 
qui est de même nature que À, c'est-à-dire singulière si À est singulière, 
non singulière si À estnonsingulière. Cette remarque s'applique également 
à BA. 


3. OPÉRATIONS ÉLÉMENTAIRES SUR LES MATRICES 


Etant donnéeune matrice À,on appelle opérations élémentaires les opé- 
rations qui consistent à : 


a) Multiplier une ligne ou une colonne de À par un scalaire non nul. 
b) Intervertir deux lignes ou denx colonnes. 


c) Ajouter aux éléments d'une ligne (ou d'une colonne) les éléments 
d'une autre ligne (ou d'une autre colonne) multipliés par un même 
scalaire, 


Nous allons montrer que chacune de ces opérations revient à multi- 
plier À par une matrice d'un type particulier, non singulière, que nous 
appellerons matrice élémentaire. 


La matrice déduite de À en y remplaçant a, par À a, est le produit 


de À par la matrice à J' 


O'OMOM? 
S' Our © 
SIN en Ke) 
 ONOE © 


à droite 


La matrice LA admet l'inverse 
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. Soit maintenant A la matrice déduite de À en y intervertissant les lignes 
de rang s et t, de sorte que 


sj j à à , 
Mettons À sous la forme 
SE 
X étant une matrice x | à déterminer. Nous aurons 


ii É 2 %in &hj 


Pour i { 4,t, nous aurons ainsi «pe ôih (indice de Kronecker). 


Pour i = 4, nous aurons 


Xch = O0 pour h # t 
Xst = 1 

et pour i=t 
X+h = O0 pourh s 
X, = 1 


La matrice X est ainsi déterminée par les conditions suivantes : 


Dans chaque ligne figure un élément non nul et un seul. Cet élément 
a pour valeur 1. Il a pour rang, d'une manière générale i dans la i° ligne, 
à l'exception des deux lignes de rang 4 et t. 


Dans la ligne de rang 4, il a pour rang t, et dans la ligne de rang t, il 
a pour rang 4. 


La matrice X est non singulière, puisqu'elle est sa propre inverse. 
Il est évident en effet que 
Mrs speiir he 
On voit sans peine que pour intervertir deux colonnes, il suffit de mul- 
tiplier À à droite par une matrice analogue à X. 


Considérons maintenant la matrice carrée 


1 k 0 

(0) 1 0 
P = 

0 0 1 


dont tous les éléments sont nuls, sauf ceux de la diagonale principale, et 
l'élément (1, 2), qui est égal à k. Nous avons ainsi 
10. 
Pi; ij 
P LR 
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Dans ces conditions, si B = AP, nous voyons que : 
bi; = } &h Phj tee) (j À 2) 
h 
bn L &p Ph = ka, ta, 


B se déduit de À en ajoutant à la deuxième colonne (a;, } les éléments 
de la première colonne (a; ) multipliés par k. Pestune matrice non singu- 
lière, puisque son inverse est évidemment la matrice 


1 -k 0 

0 1 0 
1 _ 

0 0 1 


Pour ajouter aux éléments de la deuxième ligne les éléments de la 
première ligne multipliés par k, il suffira de multiplier À à gauche par la 
matrice P’ déduite de P en intervertissant lignes et colonnes : 


1 0 0 
k 1 0 

Pt = 
0 0 l 


Pour ajouter à une ligne quelconque les éléments d'une autre ligne 
multipliés par k, soit, pour fixer les idées, les éléments de la 3° ligne, 
multipliés par k,à ceux dela 5° ligne, nous pourrons intervertir les lignes 
l et 3, puis les lignes 2 et 5, multiplier à gauche par k, puis intervertir à 
nouveau les lignes 1 et 3, puis les lignes 2 et 5.Ces opérations successives 
sont toujours des opérations pouvant s'exprimer en multipliant À par des 
matrices des types X et P; on multiplie ainsi À par une matrice non singu- 
lière. 

Ces principes étant posés, nous voyons qu'étant donnée À absolument 
quelconque, on peut, par des opérations élémentaires : 


changer a, en 1. 


annuler Apps Ags +. Apr dy dy .. Am: 
changer a,, en 1. 
annuler 2,3» A » sr Bip gps po ce. Am? 


et ainsi de suite. 


Cette suite d'opérations sera arrêtée seulement lorsque A aura pris la 
forme suivante 


1 0 0 
(0) 1 (0) 


0 0 1 : (A Elo) 
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dite matrice unité tronquée, où tous les éléments situés en dehors de la 
première diagonale seront nuls, et où, dans cette première diagonale, tous 
les éléments seront nuls à l'exception des r premiers qui sont égaux à 1. 


On peut ainsi, à toute matrice A (ha )’ associer deux matrices carrées, 


L 


admettant des inverses, soient B et C, telles que 


FC mo) À nn) D [ns n) us: r;n) 


La détermination de C et de B peut se faire d'un grand nombre de ma- 
nières : les opérations élémentaires que nous venons de décrire permettent 
d'obtenir C et B par des calculs rationnels. En multipliant l'égalité trouvée 
par C à gauche et B' à droite, nous obtenons : 


À = a Sr 


4.- MATRICES UNITÉS TRONQUÉES 


Une matrice unité tronquée E étant comme nous l'avons vu, 
: ( ) 


MED 
une matrice rectangulaire (m,n) dont tous les éléments sont nuls, sauf ceux 
de la diagonale principale, lesquels sont égaux à 1 pour les r premiers, et 
nuls en ce qui concerne les autres, nous pouvons chercher la forme du 


produit de deux pareilles matrices. Soit donc le produit 


(mi r:#) : (n;:tr'; p) 
Ce produit est une matrice rectangulaire à m lignes et p colonnes. Les 


éléments qui sont situés sur la diagonale principale sont nuls sauf si leur 
rang est inférieur ou égal à r et à r'. Nous en déduisons que : 


1 E 1x - E = Min {r, "| 
( (mirin): F(n rip) TT A RURS QU 
La règle de multiplication (1) peut s'interprèter simplement en examinant 
l'opération 

(2) D = (m:; r'; n) X 


où X est une matrice (n, 1), et Y une matrice (m, 1). 


s 


On voit que le passage de X (qui contient n éléments) à Y (qui contient m 
éléments) se fait en prenant pour r premiers éléments de Y les r premiers 
éléments de X, et en complétant à m avec m - r zéros. La formule (1) est 
alors évidente. 


On peut, à partir de la formule (1), établir les formules 


nach 22) 7 E {m:r;n) 


E 
E (r;r; m) Em; r:n) E (n;r;r) (r; r;r) 


dans lesquelles il ne faut pas perdre de vue que r  m,r one 


L'intérêt de la matrice unité tronquée est qu'elle représente, à des 
changements de variables près, la matrice singulière la plus générale. Une 
relation telle que (2) s'écrit en effet : 


A on VOTE LE VONMENR TS Yrs1 se Ym= 
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On voit que Y ne dépend que de x,, x,, ..... > Xpr €t QUE rss -.. Ym SONt 
nuls. Il en résulte que si on veut calculer X à partir de Y supposé donné, 
ce sera en général impossible, puisque x,,,, ...., x, restent indéterminés 
Si n = r, nous avons évidemment 


X = > € n'a 
(n; n; m) 
ce qui correspond à l'égalité : 
E (n;n; m) E (m;n:n) E (n;n;n) 
Donc E , admet l'inverse gauche E | _._.  ). 
(m;n;n) ©  (n;n; m;) 


De même E admet l'inverse droite E , - 
(m; m;n) (n; m; m) 


Ces inverses ne sont pas forcément uniques. 


Il est bon, pour étudier complètement la nature des matrices E Re 
de former les produits de E 4e: avec des matrices À = A et 
(fm: Tr; n) (n, p) 


B = B . On trouve 
(P; m) 
1 
ae ve. 2 
E 
(mirin)É(n,p) = e 
0 a 0. np 
4 12 AT 
az 22 ‘+ Ca 
a a 
ri r2 DICIO r 
=RpEs à É Ê (m lignes) 
(0) 0 0 
b, be bin l b, by ; mr © «+,0 
l 
BMp/m)E(mAir,e) = be ++.bom QT à = [Pb b, -.b,.0..0 
0 
Bebe 47% 
Hs æ 0! [bb 0.0 


On voitainsique E (m; r; n) ne peut admettre d'inverse droite que sir 
= m, et que sont alors inverses droite toutes les matrices de la forme s 


ET, El 
An. 5) = 
a (ne rer 


: ST 5 s 
c'est-à-dire les matrices obtenues en ajoutant au dessous de la matrice 


E (r, r, r) (matrice unité d'ordre r) n-r lignes comprenant r éléments 
arbitraires. 
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5. UNE PROPRIÉTÉ DES MATRICES RECTANGULAIRES 


Soit À une matrice rectangulaire large", c'est à dire possédant plus 
de colonnes que de lignes 
A = A (m, n) m < n 
Il existe alors des matrices à une colonne 
XX 
( 


telles que AX soit nulle, sans que X le soit. Pour montrer ceci, commen- 
çons par examiner le cas d'une matrice E (m, r,n). 


SisX a lesséléments,x,,x,, ..:,%n, la matrice E (m, r,n) X a les 
composantes x,, x, x., 0, 0, ..., O0. Il suffit donc de prendre pour X la 
matrice donti:les r premiers éléments sont 0, les n-r autres 1, que nous 
notons 


XL 0, 


pour obtenir l'égalité 


En cn) ee = 0 


Soit maintenant A. Nous pouvons mettre cette matrice sous la forme 


AééezerBE Bemcet B fon dCdais EG 
(m, m) ( 


(m,r,n) C Don) 


B et C étant non singulières. Pour obtenir AX = 0, il suffit de choisir pour 
X la matrice 


laquelle n'est pas nulle, puisque si elle était nulle on obtiendraïit en multi- 
pliant par C à gauche 


0, 
0 == 
br 
On vérifie bien que 
0e 
PE nl CPE re: 2) = B.0=0 
Loir 


La proposition : 

L'équation AX = 0 admet toujours, sim < n, des solutions en X dif- 
férentes de zéro!', 
n'est autre que la proposition bien connue : 


Un système de m équations homogènes à n inconnues admet toujours 
sim < n, des solutions différentes de zéro". 
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On peut, à l'aide des résultats ci-dessus, traiter des problèmes tels 


que le suivant. 


Problème I 
Montrer qu'il est impossible de mettre une matrice unité E Er 


sous la forme 


E=BC BB CRE TS (p < n) 


c'est-à-dire sous la forme d'un produit de deux matrices rectangulaires 
dont la première est ''haute'' (davantage de lignes que de colonnes) et la 


seconde ‘large''. 
Il suffit pour montrer cela de faire intervenir une matrice X telle que 


X # 0 GX 0) 
Nous savons que de telles matrices existent. De l'égalité 


E X = BCX 


on déduit alors 


ce qui est contradictoire. 


6. RANG D’UNE MATRICE 


Nous sommes maintenant en mesure de définir le rang d'une matrice. 
Ce sera, pour une matrice A Ga, =): le plus petit entier r tel que l'on 
L 


puisse mettre A sous la forme 


A = BC B=B C=cC 
ES ET Fo 0 


La première chose à faire est de vérifier que le rang de E ta ) 
» F, n 


est r. Soit r ce rang. Nous voyons tout d'abord que 


E E 
Gnesreen) (m, r,r) ÉR r) 
ce qui montre que r Z r.Supposons maintenant que l'on ait mis E ( ) 
mer, nn 
sous la forme 
E = me =. 
(mrecein) DT) ee) 
Nous aurons alors 
E E E = = 
(r, r, m) (nm, r,n) (ns sn) te ii) Mere 


B = Cr E = 
(m, 5) | | (5,2n) (nsers s) | Ex, FES r) 
D'après les résultats trouvés à propos du problèmel, nous voyons que r DU 
Donc r =r. 


Pour déterminer le rang d'une matrice quelconque À, il suffit de procé- 
der à sa réduction par les opérations élémentaires. 
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Par de telles opérations, on peut en effet mettre A (m, n) sous la 
forme 


(3) A=BE (m; r;:n) C 


B et C étant non singulières. Le nombre r qui figure dans (3) est le rang 
de A. D'une part en effet, la formule (3) peut s'écrire : 


(4) A [8 (m, m) E (m: r; | LE (ri ri 2) Cr: ) | 
où nous voyons apparaitre une décomposition de À montrant que le rang 


de À est au plus égal à r. 


D'autre part, si l'on a mis A sous la forme 


As si 2Be (ma); (Er, n) ru: 


on en déduit 


En r,n) "(D 8)" Crée) 


d'où Le Sirer 
le rang est donc bien +. 


Il résulte de la définition même du rang que le rang d'un produit est au 
plus égal au rang de celui des facteurs qui a le plus petit rang. En effet, 
toute décomposition d'un facteur en un produit de deux matrices conduit à 
une décomposition du produit tout entier en un produit de deux matrices. 


7. RELATION ENTRE LE RANG ET L’EXISTENCE DES INVERSES 


Toute matrice À admettant un rang bien déterminé, nous appellerons 
matrice (m; r; n) une matrice à m lignes, n colonnes, de rang r. 


Une matrice (m; r; n) admet une inverse droite unique ou non si r = m 
et dans ce cas seulement. Soit en effet A une telle matrice, et A son in- 
verse droite (ou une de ses inverses droite). A' est une matrice (n, r, m). 


Nous avons alors 
(5) E (m;m;m) = Af(m:r;n) A'(n:#; m) 


Le rang de E est m. Donc le rang de À et de A doit être au moins m. 
Comme il ne peut dépasser m, nous avons r = r! = m. Seules les matrices 
A (m;m;n)(n > m)peuvent donc admettre une inverse droite. Recherchons 
une telle inverse, et mettons À sous la forme 


Am:m; nl =  Bim,m)Em; m:n)C ln.) 
B et C étant non singulières. Cette transformation peut toujours se faire, 
avons nous vu, à l'aide de transformations élémentaires. Cherchons une 


inverse droite de E (m; m; n). Ce sera une matrice (n; m; m); soit 


“ i] cette matrice. Comme 


E (m;m;n) = | | 
(m, n) 
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le produit de E (m;m;n) par la matrice cherchée aura pour terme général 


ER 1 on 


n 
Ô.: = 6. éi: -=e ;:: 
: 2 Pain " PONT 


Nous aurons ainsi 

= 0. TO K me Li 
ei arbitraire pourm+l<i<n 
Il existe donc une infinité d'inverses droite de E (m,m,n), dépendant 


de m (n-m) paramètres arbitraires. Soit £ une quelconque de ces inverses 
droite. La matrice 


sera alors une inverse droite de A. 


On montrerait de même que la condition nécessaire et suffisante pour 
que À admette des inverses gauche est que r = n. Dans ce cas, À admet 
une infinité d'inverses gauche, dépendant den (n -m)paramètres arbitraires. 


En ce qui concerne les matrices carrées, nous constatons alors que la 
condition nécessaire et suffisante pour qu'une matrice carrée (n,n) admette 
une inverse est que r = n. L'inverse est alors à la fois droite et gauche; 
elle est unique. 


8.- DISCUSSION D'UN SYSTÈME D’ÉQUATIONS LINÉAIRES 


Soit À (m; r; n)une matrice. Nous pouvons lui associer le système 
d'équations linéaires 


(6) AGX en + MY 
aux inconnues x, ,X,, ..., Xp Ys Y,s -..: Yn Sont les seconds membres 
des équations (6). Sous forme explicite, nous obtenons : 
t _ 
(6') Si ne et ER 0 
dre, ot 6 Ÿ d;n Xn à Yo 
Ab ra Emeol ré ie Ye 


L . . 
Décomposons À, par des opérations élémentaires, sous la forme 


À \= BE(m;r;n)cC 
et posons 
Rime niCnT SORTE 4 
Le système (6) prend la forme 
(7) EN E N) RE 


qui est équivalente à (6), puisque la correspondance entre X et X et entre 
Y et Y, est biunivoque. Le système (7):n'est:autre que : 


(ab) Au y LP SMSMOMEE SGD T. 
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(7!) . = Vs NT vs = 0 


(7) Kpy3 » Æpypr + y arbitraires. 

Le système (6) n'admet donc de solution que si Y satisfait à m-r con- 
ditions; ces conditions étant satisfaites, la solution X contient n-r paramè- 
tres arbitraires. 


9. MATRICES DE PERMUTATIONS 


On appelle matrice de permutations une matrice produit de matrices 
élémentaires du type X (1). Si on multiplie à droite une matrice À par une. 
matrice de permutation, on opère une permutation des colonnes : sion la 
multiplie à gauche, on opère une permutation de lignes. Les matrices de 
permutation sont non singulières. Elles sont carrées. Dans chaque ligne 
figure un élément, et un seul, égal à 1, les autres éléments étant nuls; il 
en est de même pour les colonnes. 


Soit une matrice quelconque A. Nous pouvons nar des permutations 
portant sur les lignes et les colonnes, et par des additions portant unique- 
ment sur les lignes, annuler tous les éléments se trouvant au-dessous de 
la première diagonale, et faire en sorte que les r premiers éléments dela 
première diagonale soient non nuls, tandis que les éléments des lignes de 
rang plus grands que r sont tous nuls. 


Nous mettons ainsi À sous la forme 


(8) A = AE 


où P est une matrice de permutation, B une matrice non singulière, et A 
une matrice telle que 


| &i| ä = O0 pour i < j 
a pda Di Ass, 841" Bret as) = 0 
(j # Li, 2, +...) n) 


pl 
il 


La matrice À peut évidemment se mettre sous la forme 


As SE mr:nLEe 
puisque par des opérations sur les colonnes on peut y annuler tous les élé- 


ments situés en dehors de la diagonale principale. r est donc le rangde la 
matrice primitive A. 


10- SYSTÈMES HOMOGÈNES 


La décomposition (8) permet de discuter commodément un système 
homogène. Soit en effet le système : 


(9) se M A 
qui est équivalent au système 


(10) AK = APX = . 0 


(1) cf p. 13. 
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qui s'écrit 


(11) a, %, tisane, 23, M, Fe lMS A 0 
IE 4 _ = er 

8, 2, + eee +8, Rp À Bones Rpgs ce + Sn Zn 
dr Xp + Apres Xpgs À ee + Se nXn 0 


Les m-r dernières équations sont omises, les coefficients äij corres- 
pondants étant tous nuls. 


Dans les équations (11),tous les ai, sont différents de zéro. Il en résulte 
queX,,, » Rhypos X, peuvent être pris arbitrairement, et que X, ; X,» dns X, 
sont alors déterminés d'une manière unique. Si nous remarquons que X ne 
diffère de X par la numérotation des inconnues, nous concluons : 


Dans le système homogène (8), ou A est une matrice (m; r;n); il existe 
n-r inconnues que l'on peut se donner arbitrairement. Les r autres s'en 
déduisent d'une manière univoque. 


Revenons maintenant au système (6). Ce système n'a de solutions que 
si les équations (7'') sont satisfaites; or ces équations (7'') constituent un 
système, homogène, de m-r équations à m inconnues. Ce système a une 
matrice de rang m-r, qui n'est autre que 


B' LE (m;°m;,m) -"E (m;r; m) | CSS - 2 Q, E (m; m-r; m) Q, 


où Q, et Q, sont des matrices de permutation. 


Il existe donc, parmi les y,, r nombres y; qui peuvent être pris arbi- 
trairement, les m-r autres s'en déduisant d'une manière univoque. 


Nous voyons ainsi que nous pouvons, par une permutation convenable . 
desx;et des x; faire en sorte que les r premiers y; et les n-r derniers x; 
soient arbitraires. 


Supposons cette permutation faite, et considérons les équations (6) où 
nous supposons que les x; sont des variables indépendantes . Quels que soient 
les x;,les y,,, ; Yuzr -..1 Ym S'eXprimeront linéairement en fonction de y,, 


Ypr ++.» YL- llen résulte que les m-r dernières lignes de A s'expriment en 
fonction des r premières. 


Si donc une matrice À est de rang r, il existe r lignes en fonction des- 
quelles on peut exprimer toutes les autres par combinaison linéaire. 


Nous verrons plus tard que le rang d'une matrice n'est pas affecté par 
l'interversion du rôle des lignes et des colonnes. Il en résulte que la pro- 
position ci-dessus a son équivalente (avec la même valeur de r) en ce qui 
concerne les colonnes. 


CHAPITRE IV 


ALGÉBRE DES MATRICES CARRÉES 


1  L'algèbre matricielle est surtout attachée aux matrices carrées, parce 
que seules de pareilles matrices peuvent être élevées à des puissances, et 
permettent donc de généraliser la notion de polynome. 

Nous aurons principalement dans ce qui suit à nous occuper d'expres- 
sions ayant l'une des formes suivantes : 


1) Des polynomes à variable numérique et à coefficients matriciels, 
c'est-à-dire des expressions telles que 


tes: LAS de Aie gannn sand et N) 


où À est un nombre, AA À, Se AE des matrices carrées de même 
ordre. 


2) Des polynomes à coefficients numériques et à variable matricielle, 
c'est-à-dire des expressions de la forme 


(2) ART A HE + 0, D'= -g (A) 


où 4, à, ..., am Sont des nombres, et À une matrice. 


On sait qu'en général le produit de deux matrices dépend de l'ordre 
des facteurs. Ceci est une gêne considérable dans des calculs portant sur 
des expressions telles que (1) ou (2). Dans ce chapitre, nous supposerons 
donc, sauf mention contraire, que nous avons affaire à des matrices per- 
mutables, c'est-à-dire telles que 


AB = B À 


Les calculs que l'on peut faire sur de pareilles matrices sont assez 
généraux, d'après les propositions suivantes : 


: : n 
Etant donnée une matrice A, les matrices A! et A' sont permutables. 
Ceci est évident; nous avons 


m n n m m+n 


A , A = + A DA = A 
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Si A et B sont permutables, et si f (A), g_(B) sont deux polynomes en 
A et B à coefficients numériques, f (A) et g (B) sont permutables. La dé- 
monstration résulte du fait que le produit f (A) g (B) ne fait intervenir que 
des monomes de la forme 


m n 


A B 
qui peuvent s'écrire 
APPARUE 


et dans lesquels, par permutation répètée de deux facteurs consécutifs, on 
peut, sans changer le produit, placer les facteurs dans un ordre quelconque. 


Si A et B sont permutables, et si B admet une inverse p'! ,_À et B°' 
sont permutables. Partons en effet de l'égalité 


AB = BA 
Multiplions à droite et à gauche par B'!, nous obtenons 
BASA UE N A BE 


D'une manière tout à fait générale, on peut considérer des polynomes 
à plusieurs variables matricielles f (A, B, C) et même des expressions 


CARE. C) 


BL sgtasBs.c) 
représentant le produit de lamatrice f (A, B, C) par l'inverse de la matrice 
g (A, B, C). Si A, B, C sont permutables, toutes les expressions de la 


forme (3) sont définies sans ambiguité (si g-! existe), c'est-à-dire peuvent 


s'écrire indifféremment f g''ou g"'f. De plus toutes ces expressions de la forme 


(3) sont permutables, avec À, B, C etentreelles, et peuvent par conséquent 
entrer dans la formation de nouvelles expressions rationnelles. 


Nous allons montrer, sur un exemple, la nature des problèmes que 
l'on peut ainsi traiter. Considérons la matrice du 2e ordre 


a b 
A = 
€ d 


Elevons-le au carré; nous obtenons 


5 a b a b & +bc b (a + d) 


A = = 
c d c d c (a +d) bc + d°) 


Nous voyons apparaitre les éléments b (a + d), qui sont les éléments 
correspondants de À multipliés par a + d. Ceci nous conduit à former la 
différence 

a +bc - a (a +d) 0 


- (a+d) A = : = (bc -ad)E 
0. belbdte d (tu) 


A° 
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La matrice A est donc racine de l'équation 
(4) Aa +d)Att(adebc)E = 0 
obtenue en formant le polynome 
HN Del ar a) Liad es be 
en y remplaçant À par A,eten égalant à zéro. On remarque que l'équation 


(@) permet immédiatement de former l'inverse de A, puisque, si ad - bc Z 


a +d A 
A| ——— E- = E 
ad - bc ad - bc 
d'où il apparait que 
1 
A" = | 
ad - bc 
1 a +d 0 a b 
ad - bc 0 a +d G d 
1 
| -b 
ad - bc 
-C a 


Le dénominateur ad - bc, terme constant de f (À), n'est autre que le 
déterminant de la matrice A, et f (À) lui-même n'est autre que le détermi- 
nant de la matrice 


a-À b 
c À 


Nous avons ainsi montré pour une matrice d'ordre 2,° que si on forme 
le déterminant de A-XÂE 


LH [a-Xxer | 


et si on remplace À par À, on obtient une matrice nulle. 


= d'A E 


2.- INVERSE D’UNE MATRICE CARRÉE 


Rappelons un résultat classique sur les déterminants. Nous appellerons 
[A| le déterminant formé avec les éléments d'une matrice carrée 


a = [«] 


Nous appellerons 3: le cofacteur de ai; dans le développement de Al, 


c'est à dire le coefficient de à) dans l'expression du déterminant; on sait 
que ce cofacteur est 


à: (-1)Ÿ A; 
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en appelant À ij le déterminant du tableau obtenu en supprimant, dans le 
tableau des éléments de A, la ie ligne et la je colonne. On sait de plus que 


E a; à, © |A] , quel que soit i. 
a, à; = |A] , quel que soit j. 
Ea; à = 0 , quel que soiti, sih# i. 
a 3, = 0 , quel que soit j, sih# i. 


La matrice 


>! 
M 
PS 
pi 
= 
Es" 


est la matrice adjointe de A. 

Considérons la matrice transposée de A, que nous désignerons par À 
c'est à dire la matrice déduite de À par échange des lignes et colonnes. 
Elle sera de la forme 


(4) FES [âi] à = (-1YVaïñ 
On vérifie alors que 
RACE CAR Pre ANT 


c'est à dire que le produit d'une matrice par son adjointe transposée est une 
matrice dont tous les éléments sont nuls, sauf ceux de la diagonale princi- 
pale, qui sont égaux à |A]. 


Si donc [A] # 0, nous avons l'expression de l'inverse de A (dont nous 
savons que si elle existe elle est unique) : 


= À 

(5) + = JA] : 
Si [A] = 0, A ne peut pas avoir d'inverse. En effet, les règles de multi- 
plication des déterminants montrent que 

ss paf 
d'où 

=1| es = 
jap. Ja] = [El = 2. 
Si [A] = 0, cette dernière égalité est impossible. Donc la condition 


A # Oest nécessaire et suffisante pour l'existence de l'inverse, qui a 
toujours, quand elle existe, la forme (5). 


3.- INVERSE D’UNE MATRICE A - XE 


Considérons une matrice À, d'ordre n, et la famille des matrices A - 
À E, dépendant du paramètre numérique À . Le déterminant de À - À Eest 
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un polynome de degré n, que nous notons 
f(A) = |JA-XE | 


La matrice adjointe transposée de A - À E est une matrice dont chacun 
des éléments est un polynome de degré n-1 au plus, puisque chaque élément 
est lui-même le déterminant d'un tableau à n-1 lignes et n-1 colonnes, dans 
lequel À figure au premier degré. 


Si nous ordonnons en À cette adjointe transposée, nous obtenons un 
polynome en À à coefficients matriciels 


CSC CT OR PE ee 2-7 
Le produit de g (À), matrice adjointe de A - À E, par A - À E est égal à 
f(À)E, puisque f (À) est le déterminant de A - ÀE. D'où 


D nl - ‘he 


Développons le membre de gauche en respectant l'ordre des facteurs, 
précaution nécessaire puisque nous ne connaissons pas la nature exacte 
des matrices B, et ordonnons en 


(6) -BX +(AB,-B,)X"' +(A B, -B 


DA Be UNITE 


Cette égalité matricielle, d'après la définition de l'égalité de deux matrices, 
équivaut à n? égalités entre nombres. Considérons l'élément occupant la 
place (e;;) dans la matrice située à gauche du signe égale; et l'élément oc- 
cupant là même place dans la matrice de droite. Ils sont égaux; ce sont deux 
polynomes en À ; l'égalité a lieu quel que soit À ; donc les coefficients des 
puissances semblables de À sont égaux. Cette égalité des puissances sem- 
blables de À ayant lieu dans chaque élément, il en résulte évidemment qu'il 
a lieu si on considère les coefficients de À dans (6). Explicitons f (À) : 


LT + (-D'u,] 


n-2 


FLO = CLARA RAR 


Nous obtenons : 
n-1 


Bré .(-1)}° 
AB D. - (-U'WE 
AB,-B, = (op, E 


Nous voyons que B,, B,, B,, ... sont des polynomes en À, de degrés res- 
pectifs 0, 1, 2, ... et que par conséquent le polynome matriciel g (À) ne 
contient que des coefficients permutables entre eux et avec A. Nous sommes 


dans le cas favorable où nous n'avons pas à nous préoccuper de l'ordre des 
facteurs 


Considérons maintenant le polynomef (À); si nous y remplaçons par A, 
nous obtenons la matrice f (A). E (lefacteur E intervenant pour que le terme 
constant de f (À), s'il yen a un, prenne forme matricielle). f (À) E peut 
s'écrire sous la forme (6). Nous en déduisons que : 


HUE CCE AUIPI(AD -. BJ) A + ... + AB, 
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et par conséquent, puisque nous pouvons intervertir l'ordre des facteurs, 
nous avons f (A) = O0, * 


Le polynome f (À) s'appelle polynome caractéristique de A. Nous 
avons donc montré que si 


£(N) = |A-2XeE| 


on a 
f(A) = 0 


et que la matrice inverse de A - À E est de la forme 


EN AUBIN DNS ONE: 
-1 
(7) (A-XE) = 
f (À) 
où B,, B,, ..., B, Sont des matrices pouvant s'exprimer par des poly- 


nomes en À, et qui sont donc permutables avec A et entre elles, 


Si f (0) Z 0, c'est-à-dire si [A] # 0, À admet une inverse, qui s'ob- 
B 
tient en faisant simplement À = 0 dans (7), d'où A°! = So): 


Nous voyons par conséquent que des opérations rationnelles sur une 
matrice nous conduisent à des matrices permutables, et que par consé- 
quent nous pouvons dans beaucoup de cas opérer comme en algèbre ordi- 
naire. Proposons nous par exemple le problème suivant, cù nous prenons 
délibérément les notations de l'algèbre ordinaire. 


4.- PROBLÈME Il 
A étant une matrice, et À un nombre, est-il correct d'écrire 
SR PP DE vaut Per 
A -X A ARR)" 
Nous n'insistons pas sur le fait que + est écrit au lieu de A AN En 
lieu de A-XE. 
La formule est correcte. 


Posons en effet 


DENON. 
FRE ESS 
ANCANE FE JR. - «Ti 

La formule signifie que 

B-C = XD 
ou encore que 
At S 
BD 01181 SGD 0 * RE 


* Il est d'usage d'omettre le facteur E dans f (A). E, aucune confusion n'étant 
possible. 
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BD =) BA(AL ÀE) 


D'après la définition de B, nous avons 


ROME EN ANT 
d'où 
RE An (AT NE = À - ÉANELS NBA eh = 
De même 
CDTI A CAE A, RL ONE 


La formule est bien correcte. 


Nous pouvons, dans le même esprit, tirer de (7) les valeurs de B,, 
1 € 


5.- PROBLÈME ii 


Exprimer B,, B,, ... B, en fonction de rai, (en utilisant la formule (7). 


La formule (7) peut s'écrire 


+ fi M sic: E- £(X) 


En faisant À = 0, nous obtenons 


f (0 
B, ; LQ 
d'où 
e -3 
RENE TR ere + [09.20 


Faisons À = 0 dans cette expression. Nous avons à chercher la limite de 


APALA UD) TASSE N ) 
ÀA(A-X) 


laquelle est 
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Continuons ce processus 


“ SJ 1 LECX) £to)l  £(0) +Ar{0 
ARR COR ON SR de ones ce NA 


Nous sommes conduits, en faisant À = 0, à 
1 

Be = 5 [50 + an (0) + 
IN 1 


À 


£" o) 
2 


a! 
fn (0) +... +— £) co) 
p! 


et par conséquent 
1 A? 


B = É (0) + Af' (0) + 


n-p AP*1 


IN x 


Tous les B sont ainsi des polynomes en A , de forme relativement simple, 
B, est alors de la forme 


LR age É (0) +A f' (0) + 


2 n-1 


A A 
£ (0) +... + ——— mio) 


A 1 2 a 


On peut remarquer alors que 


(Xe sie f(0) A ft (0) 


et que par conséquent, puisque f (A) = 0 


(n) n-1 
DURE. st fon (0), CIRE 
A ra à 


conformément à ce qui a déja été vu. 


6.- RELATION ENTRE LE DEGRÉ DU POLYNOME CARACTÉRISTIQUE 
ET LE RANG D’UNE MATRICE CARRÉE 


Une matrice carrée de rang r peut se mettre sous la forme 


Are BE, JT = De C: 


H'ÉT EN 
où e est une matrice unité tronquée, B et C deux matrices non singulières, 


et admettant par conséquent des inverses. Considérons maintenant le poly- 
nome caractéristique de A : 


f(X) = |A-XE| 
Nous pouvons l'écrire 
Ab | 5° en NE | 
ou encore 


HU) = | 8° (ee x Bo) c"| 
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d'où nous tirons 
Le-Meoles is Ale es En) 


- Nous savons que |B| et |c| sont deux quantités non nulles. Les coef- 
ficients nuls de f ( À ) sont donc ceux de 


Ÿ, (À ) = | e = X M| 
M étant une matrice non singulière. Posant = 13 ; nous voyons que 
n 
RICE Je sax pe-M| 
Le déterminant | M -f e| est un déterminant analogue à un polynome 


caractéristique, avec la différence que la matrice unité E y est remplacée 
par une matrice unité tronquée. 


: n-r 
Ce polynome est manifestement de degré r. Donc f (À ) contient À 
en facteur. Donc : 


Les matrices carrées de rang r sont caractérisées par le fait que le 
polynome caractéristique a n-r racines nulles. 


7. DIAGONALISATION D’UNE MATRICE CARRÉ QUAND f (À) a n 
RACINES DISTINCTES 


Supposons que le polynome caractéristique f (À ) de A ait n racines 
distinctes Xp . Pour chacune de ces racines, nous avons : 


|A- XE = 0 


Le système d'équations linéaires 
Y: 


(A- AE)X = 0 


admet donc au moins une solution non nulle. Soit X; une de ces solutions. 
Nous avons par conséquent 


AR = Nr . (pe 2) Sie) 


Le vecteur X; est un vecteur colonne. En juxtaposant ces colonnes, 
nous obtenons une matrice 


B = Pxxs es 0 x, | 


qui est non singulière. Si en effet elle était singulière son déterminant se- 
rait nul, etilexisterait entre les colonnes une relation linéaire de la forme 


Re tient, X, = 0 
d'où l'on déduirait par multiplication par A. 


KA EX, HER A EEE kOXAEX, = À 
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et par nouvelle multiplication 


2 2 Le 
RNA RS NERF NE ET 0 


et ainsi de suite. En éliminant les coordonnées de X,, X,, ..., X, entre 
ces équations, on obtiendrait 


1 1 1 
X, À \ à 0 
on +4 x’ 1 


ce qui est impossible, puisque ce déterminant, qui est de Vandermonde , | 
ne peut s'annuler pour des À, distincts. La matrice B admet donc une ma- | 
trice inverse B°', qui peut s'écrire sous la forme 


PE (us. Terre U) 
c'est à dire d'une juxtaposition de n vecteurs ligne, tels que 
Si nous formons le produit 
B' AB 


nous voyons alors qu'il prend la forme 


D -}x à 


d'une matrice dans laquelle tous les éléments sont nuls sauf ceux de la! 
diagonale principale qui sont les À: . À peut donc se mettre sous la forme 


À. = BD: 


D étant une matrice diagonale. L'opération qui a consisté à chercher B de | 
manière à mettre À sous la forme ci-dessus s'appelle diagonalisation de A. 
Cette opération est particulièrement simple quand f ( À )a des racines 
distinctes. 


Lorsque f (À ) a des racines multiples, la situation est plus compli- | 
quée, comme lemontre le problème: ‘ 


8.- PROBLÈME IV 
Mettre sous forme diagonale la matrice 
a b 
A = 
© d 


en supposant que f (À ) a une racine double. 


f(XÀ )a ici la forme 


KE (8 FORT 
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I1 y a une racine double si 


(a +d) - 4ad+4bc = 0 


c'est-à-dire si 


(a-d)} +4bc = 0 
Soit À, la racine double. Nous avons alors 
Ad 2x, 
ad - bc = K, 


Supposons à # d, auquel cas b et c sont tous deux différents de zéro. 
Nous pouvons poser 


a = AK d = À -k 
b = pk c 5 - 


Nous avons alors 


Soit B une matrice quelconque non singulière, que nous supposerons 


de déterminant égal à 1, ce qui ne restreint évidemment pas lagénéralité. 
Nous aurons ainsi 


1H RE: 


B== B= CO Val 


5 ed à 
nr pla | 
ô }? Bé | 
pu | y) ne a ô-Fy 
La réduction à la forme diagonale est impossible, puisqu'il faudrait avoir 
à la fois 


Pe ape EM A 
ce qui est incompatible avec œ Ô - By = 1 


On ne peut annuler qu'un élément dans la matrice réduite, soit le terme y _Ô 


Posons par conséquent : 


ô = py 
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Nous avons alors 


X, 1 
vè 
DA tRS je 
0 À, 
Si He > 0, nous pouvons prendre Ÿ = + , ce qui conduit à la forme réduite 
ct \ ! 
B A B = 
0 À 


0 


Si a = d,undes éléments b ou c est nul; la réductionest encore impossible, | 
sauf si b = c = 0, auquel cas elle est déja faite. | 


9. RÉDUCTION D’UNE MATRICE SYMÉTRIQUE 


Une matrice symétrique est une matrice telle que 
nt no Ci | 
Pour étudier commodément de telles matrices, on utilise l'opération 
de transposition, qui associe à toute matrice 


AT has [eu] | 


A! 


la matrice 


| 
(CE 
p 
ET 
sn j 


avec 


ai; S El 
La transposition est simplement l'échange des lignes et des colonnes. On 
vérifie que 
-1 “ 
(ANDRE 


et que 


(AB)! Se BAR ABG) RANGS TA 


Il faut prendre garde que A!', quoique étroitement liée à A, n'est en général 
pas commutable avec A, c'est à dire que AA! # A'A. 


Pour en revenir aux matrices symétrique, elles satisfont à la condi- 
tion (nécessaire et suffisante) : 


À = A! 


Soit donc À une matrice symétrique, dont nous supposons d'abord que 
le polynome caractéristique f (À) a toutes ses racines distinctes. 


Soit X un vecteur propre associé à la racine À, 
AXES EX 


Nous pouvons supposer que la somme des carrés des éléments de X est 
égale à 1 ce qui s'exprime par 


X'X = 1 
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Si X est réel, cela revient à multiplier tous les éléments par un 
| même nombre, ce qui ne change rien à la propriété d'être un vecteur 
propre, non nul associé à À ,. Nous allons voir que l'on peut supposer X 

réel. Si en effet À, ou X étaient complexes (A étant réelle), nous aurions 
en même temps 


AX 


NES 
AX* > c1k xt 


s 


l'astérisque désignant la substitution du nombre complexe conjugué à tout 
nombre complexe figurant dans l'expression. 


Nous déduisons des égalités ci-dessus 


ROLE UPS En ie SÉLE 
PONT EN A D'ÜR'ée 


Les expressions figurant au premier membre sont transposées l'une de 
l'autre; ce sont des matrices (1, 1). Elles sont donc égales. De même 


X'* x = X! X* 


sont égales, comme transposées, puisque ce sont des matrices (1, 1) 
c'est-à-dire des nombres. Il en résulte que À, = À*, toutes les racines 
de £ (À) sont réelles. Comme X est une solution du système homogène. 


(AS N EMX 2 =N80 


à coefficients réels, nous pouvons supposer que X est réel. Nous pouvons 
ainsi, à la matrice symétrique À, associer n racines réelles À, À, ..., 
A,(que nous supposerons distinctes) de f (À) = 0, et n vecteurs propres 
réels X; satisfaisant à 


AXEL AIX. XIX, = 1 
Nous allons évaluer X! X; . Nous avons 
AXje dE vx; 
FE RE 
d'où 
X; ASK, X; À : = KX; Xi Kx; + 


Nous voyons, par transposition (A étant symétrique), que 


X; AX, = XjA #; (égalités entre nombres) 
X; À = X; X; 


d'où il résulte, puisque x; À À, ,; que 


K11X RAC si #3 
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Nous avons donc d'une manière générale 
! es 52 
Si donc nous posons 


5 2 x, | 


la matrice inverse de B n'est autre que sa transposée : 


Bla = fo Éreihsa) DE : 


Une matrice symétrique À peut donc être mise sous forme diagonale à l'aide | 
d'une matrice B qui est identique à son inverse transposée. 


Xl 0 
B AB = Te (BB'=E) 
0 OX 
n 
Nous avons vérifié cette propriété lorsque tous les À; sont distincts. Elle 
reste vraie même s'ils ne sont pas distincts, comme nous le verrons plus 
bas. | 


Les matrices B satisfaisant à BB' = E jouent un rôle particulièrement 
important dans les applications du calcul matriciel. On les appelle matrices | 


orthogonales. 


10.- GÉNÉRALISATION DES NOTATIONS MATRICIELLES 


Pour traiter des questions théoriques un peu compliquées, comme 
celles qui sont relatives à la diagonalisation d'une matrice quand le polyno- 
me caractéristique admet des racines multiples, on peut être amené à con- 
sidérer des matrices dont les éléments sont eux-mêmes des matrices, telles 
que des matrices de la forme 

A = | ai) | 


a;; étant lui-même une matrice. Cette matrice ai; pourra être une matrice 
de nombres, ou une matrice de matrices. Examinons le cas où a; est une 
matrice de nombres. Considérons une autre mafrice B, de même nature 


que À 


Le produit de A par B aura pour élément général la matrice 


Gi; F La, bi; 

ce qui exige que : 
le 8j, Soit multipliable par bi: 
2)- que toutes les matrices ah Ph aient mêmes dimensions 
Appelons 


m E 5} n (is j) 
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les dimensions (nombres de lignes et colonnes) de ai; , et 
m'i, j), n° (i, j) 
les dimensions de bi . Nous devrons avoir 
Den (i, h}erra rm (h:i) 
2) - m (i, h) indépendant de h 
n' (h, j) indépendant de h. 


Pour que la notation généralisée soit utilisable, nous voyons donc que 
nous sommes amenés à astreindre les a, à avoir des dimensions de la 


forme ÿ 
m ER j) Fe m (i) 
ne (lose <nru(i) 


ce qui revient à dire que les éléments ai sont obtenus en découpant dans 


une matrice À écrite in extenso les rectangles 


Dans ces conditions, étant donnée une matrice A formée de nombres 


Pres MSA Hans 


si on pose 


on pourra écrire 
et si on pose 


on pourra écrire 


U; 
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On remarquera que dans ces conditions, si on considère deux matrices 
mises sous la forme > 


{ u, u, "Sul 


y Ÿ, Rae 


le produit AB se met sous la forme 


AB = . L* Y, … | = [u | 


En particulier, l'inverse de À (mise sous la forme d'une superposition de 
vecteurs lignes U;) est une matrice B (mise sous la forme de juxtaposition . 
de vecteurs colonnes Y,) tels que 


A 


U; Y, = 6, (indice de Kronecker) 


11. MULTIPLICATION ET DIVISION DES POLYNOMES DE MATRICES 


Toute formule relative à des polynomes à variable scalaire qui se réduit 
à une identité algébrique reste vraie pour des polynomes de matrices. 


En effet, les règles de calcul sont les mêmes dans les deux cas, sauf 
les exceptions suivantes, qu'il faut toujours avoir présentes à l'esprit : 

Le produit n'est pas commutatif 

Un produit peut être nul sans qu'aucun de ses facteurs le soit. 

La non commutativité du produit, dans le cas d'une seule variable 
matricielle, ne nous gênera pas, pour la raison évidente que le produit 
de deux inonomes est indépendant de l'ordre des termes : 

(4) AA DA = ba tee A 

Le produit de deux polynomes f (A) et g(A) se fera d'après les règles 
usuelles, De même, nous pourrons diviser deux polynomes suivant les 
puissances ascendantes ou descendantes puisque les identités 


(5) £(N). =, g (x) a (Rs For (NX) 
f(N = g(Da(N + X r(N 


restent des identités si l'on substitue à À une matrice carrée quelconque 
A. De même la formule de Taylor : 


N 
fÜX RO) £ (h) + À EU (b) + _ £ (m) tb}. Fe £ (N) (h) relative 


à un polynome, qui est une identité en À et h,, resteuneidentité lor squ'on 
remplace soit h, soit À par une matrice A. Nous obtenons ainsi : 


f(A+h) = Ef(h) + are. +). 4 ù +0) 


(6) = N 
ONE RAI EN 5 a) + +2 #0) (a) +. 4 À #0) (a) 
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Remarquons que dans la deuxième formule, £(N) (A) est un polynome de 
degré 0 en À, c'est-à-dire un scalaire multiplié par E. 


Si dans les formules (6) nous faisons h = À , nous obtenons l'identité : 
X (m) À FN) 
f (A) ae A£'(A)+... + f (A) +... +Rrf (A) 


(9) 


m N 
= Ef(A) + Af' (À) + ... +5 g(n) VA)... re (R)=f(A+XE) 


12. POLYNOME TYPIQUE D'UN VECTEUR DANS UNE MATRICE 


Soit À une matrice, et X un vecteur. Considérons la suite de vecteurs 
n 
TA INR Ne ADS 


Dans cette suite figurent n+1 vecteurs qui ne peuvent donc être indé- 
pendants. Il existe entre eux une combinaison linéaire 


SPOCR dn pue lu nolalesr Peer 0 
ce qui peut s'écrire 
(1) 8 (A) X#=10 
g (A) étant le résultat de la substitution de À à À dans le polynome g (X). 
Parmi tous les polynomes g, (À) satisfaisant à (1), considérons celui, soit 
8: (À), qui est de plus bas degré. Pour l'uniformité, nous supposerons égal 


à un le coefficient du terme en plus haut degré en À . Ce polynome g, (N) 
sera appelé polynome typique du vecteur X dans la matrice À. Ce polynome 


est unique. Si en effet g, (À), g (À) satisfaisaient à (1), g (À) - g (À) y 


satisferait aussi, de sorte que g, (À) et g, (À) ne pourraient être tous deux 
de degré minimum. 


Tout polynome f (À) tel que 
COS CES) 


est un multiple du polynome typique de X dans A. Il suffit pour le voir de 


N 


procéder à la division 
DONNE (NME AUN ISERE E (X) 
d'où 
OAI € 0 


g (À) ne peut être de degré minimum que sir (À) = 0 


13. POLYNOME TYPIQUE D’UNE MATRICE 


Soit une matrice À, n vecteurs indépendants X,; MP Co X,, et leurs 
polynomes typiques respectifs g,, g;; ... Bn. 
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Comme tout vecteur est de la forme 
X = La x, 
il en résulte que pour tout X : 
(2) z (A) s,(4) mn (AIX 20 


En effet, les facteurs du premier membre de (2) peuvent être écrits 
dans un ordre quelconque. 


Parmi tous les polynomes g (À) tels que 
(3) LA) Erao 
quel que soit X, c'est-à-dire tels que 
(4) LA) RE NC 


considérons celui de degré minimum; astreignons le à avoir pour la plus 
haute puissance de À le coefficient 1. Ce polynome sera appelé polynome 
typique de A. Par les mêmes raisonnements que dans le paragraphe précé- 
dent, on montre qu'il est unique, et que tout polynome satisfaisant à (4) 
est un multiple du polynome typique. On constate de même que puisque, 
peur un vecteur quelconque X, le polynome caractéristique de A satisfait 
à (3), c'est un multiple du polynome typique de X dans A. Le polynome 
caractéristique défini plus haut est donc un multiple du polynome typique 
de A, et de tous les polynomes typiques de vecteurs dans A. 


14- POLYNOME TYPIQUE D’UNE MATRICE NON SINGULIÈRE 


Si A est non singulière, g(0) # 0, et réciproquement. Si en effet A est 
non singulière, si l'on avait g(0) = 0 on en déduirait que 


g(A)A' = 0 


g (À) : À étant un polynome f, (À) tel que f, (A) = 0. f(À) ne serait pas de 
degré minimum. 


Réciproquement, si g(0) # 0, le polynome. 


6) &Q = Es 


définit une matrice B = g, (A) inverse de À, A est par conséquent non sin- 
gulière. 


15.- RÉDUCTION D’UNE MATRICE 


Soit une matrice non singulière A, de polynome typique 


(8) BESANCON). (RAM = 8 QU 8, (NL... 8 (D) 
en posant Bi (X) =(X- ù js 
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Désignons d'une manière générale par S; l'ensemble des vecteurs X; 
"4 


satisfaisant à l'équation 
. 
(7) SUCRE EEE NT EN OEX PRG 


Ces systèmes de vecteurs sont disjoints; en effet si l'on avait à la 
fois 


g, (A) X (ARE) es 


0 


g, (A)X = (A- XE)S x 0 


on pourrait, puisque g; (À), g; (À) sont des polynomes premiers entre eux, 
écrire une identité de la forme : 


ME UN) Me) ee (NI Mer 0 


d'où l'on réduirait en remplaçant À par À, puis multipliant à droite par X, 
que X = O0. 


Par ailleurs si X appartient à S;, il en est de même de AX, puisque 
A et g;, (A) sont commutables. 


Soit maintenant un vecteur X quelconque. Il existe deux polynomes 
PhetQ telsique. 


EU e (Os (De. a Ne ti 
d'où 

MMM ME UP AO RUN PANIER CAS 
et par conséquent 

8, (4 [x-R (4e GES = 0 
de sorte que nous pouvons mettre X sous la forme 
FAR RES 

X, appartenant à S,, Y, étant de la forme 


%, =" g (A) Z, (Z;7,.= P.(A)X) 


Nous pouvons continuer ainsi, en considérant une identité 


Din Lo Ne (NN = 1 
d'où 
Y, = P, (A)g, (A) Y, +0, (A)... 8 (A) % 


et par conséquent 
4 [L-RWeUmx] = 0 


ce qui nous conduit à 
VÉUILE PCI RS 


(1) Nous utilisons encore le fait que f, (X) d'une part, le produit f, (X) £, (À),... 
f, (X) d'autre part, sont premiers entre eux. 
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X, appartenant à S,, Y, étant de la forme 
Y, = 8, (A)g, (A)Z, 


et ainsi de suite. 


En continuant ainsi, on voit que tout vecteur X est de la forme 
À ŒOEX ER IET ..e. FSS 


X,, X,, ... X, appartenant à S,, S,, ..., Sk respectivement. 


I1 ne peut exister aucune relation linéaire entre des vecteurs X,, X,, 
X4- Soit en effet, si de pareilles relations existaient, 


Ro EX = 0 (ER) 


la plus courte d'entre elles (h minimum). En multipliant par 8h (A), nous en 
déduirions une relation de la forme 


! ! = 
Xi +... + Xi, 0 CR 


d'où contradiction. 


s 


Si X, estun vecteur propre attaché à une racine À, du polynome carac- 
téristique f (X), nous pourrons mettre ce vecteur sous la forme 


X<, = CD ne cu 


Nous aurons donc 
g(A)X, = 0 
ce qui montre que le polynome typique de X, divise g (X). Or ce polynome 
typique est À - À, Donc X- À divise g (X). 
Nous concluons que : 
f (X) est un multiple de g (X), mais ne contient pas d'autres facteurs 


binomes que g (À). En d'autres termes, g (À) étant de la forme (6), 
f (X) est de la forme (au signe près) 


FO, (RENE (NON 
FAN. Mere 
RAT 


Revenons maintenant à la représentation d'un vecteur quelconque : 


| Si nous appelons b, : p,; as Bk les nombres de vecteurs indépendants 
figurant dans S,, S,, ..., S, respectivement, nous aurons 


BREL GA ES un 


et nous pourrons former une matrice P, non singulière 


- 
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telle que ses p, premières colonnes représentant des vecteurs X,, les h, 
colonnes suivantes des vecteurs X, et ainsi de suite. 


dé Les n vecteurs colonnes de P étant indépendants, P admet une inverse 
P . Si on forme la matrice P AP, on voit qu'elle est de la forme : 


DR TT Te .A[S 5 ...5,] 


dans laquelle S; est une matrice (n, f; ) composée de B colonnes, chacune 
des colonnes représentant un vecteur propre associé à À;. T représente 
alors une matrice (P;; ni), à b, lignes. La matrice DO ee Sx] est la 
matrice carrée obtenue en juxtaposant, de gauche à droite, les matrices 
S;; la matrice qui, Fan A T,] inverse de la précédente, s'obtient en super- 
posant, du haut vers le bas, les matrices Ti. Le produit 


Grues) [584]. fs] 


est une matrice unité. Nous avons alors 


T; S; S e; 


6; étant l'indice de Kronecker, et e; une matrice unité carrée d'ordre; 
La matrice D peut alors s'écrire 


D = Non tr | AS, 48, …., A5, | 


D = [ T, AS, | 
Or , d'après la définition des S; é AS;est une matrice (n, B, ) dont toutes les 
colonnes appartiennent au système S; : 


Pour if j, nous aurons 


puisque T; S, = 0. En effet, T; S; = 0 signifie que le produit par T; d'une 
colonne quelconque de $; est nul. Or chacune des colonnes de AS; est un 
vecteur du système Si, et par conséquent une combinaison linéaire des 


colonnes de Sj 3 


D prend donc la forme 


avec 
A;j = T, AS, 
À prend alors la forme 
A, (0) 
OR: CRT p°! 
0 0 A 


dans laquelle les A; représentent des matrices QUE B, ), et les zéros des 
matrices de zéros. 
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La réduction que nous venons de faire s'appelle première réduction à 
la forme canonique. 


Cette réduction ne modifie pas le polynome caractéristique. En effet : 


£(X) = [A-XE | = |p{r'ar-xes] 2 


= [D-xE 


puisque 
epet ele 


On remarque par ailleurs que 


450 |D-xE 


[A- he, [axe 


= [A;- Xe, 


d'après une règle bien connue du calcul des déterminants. 


Nous avons donc 


LA) mat (RE ONE EE CA) 


fs frs es fx étant les polynomes caractéristiques de A,, A,, ..., A, 
respectivement. 


NE OC A4 sont tels que 


> 

— 
Il 
Q 


En effet : 
8, (A) = 8; (DANS) = T, 8; (A) S, S 0 
g; (À) divise donc f; (X). 


Comme fi (X) ne peut contenir d'autres facteurs que ceux de g; (À), nous 
aurons ainsi (au signe près) 


ON MEET 


En résumé : 


. . matrice À ayant un polynome caractéristique de la forme (au signe 
près ): 


NET OP 
son polynome typique est de la forme 
wc: 
8(A) = T(A-X) œ < b; 
Si on considère les familles de vecteurs S; définies par 
(A CNE) ER 0 


il existe dans chacune de ces familles B; vecteurs indépendants. Ces familles 
sont indépendantes entre elles. 
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On peut mettre A sous la forme 


A. 0 
0 ARS 
1 
ARMES P 
0 0 A 


les A; étant des matrices carrées; A; aspour polynome typique (À - a et 
pour polynome caractéristique (X- À;)i. 

Cette réduction s'appelle première réduction à la forme canonique. 
Pour aller plus loin, il faut procéder à la réduction des matrices A; elles- 
mêmes (ce que nous ne ferons pas ici). 


CHAPITRE V 


MATRICES CARRÉES PARTICULIÈRES 


1. TRANSFORMATIONS DE MATRICES 


Etant donnée une matrice À, une matrice de la forme : 


(1) BNP rMNO (P, Q non singulières) 


est dite équivalente à A. 
Nous rappelons qu'on appelle transposée de A la matrice obtenueen 
échangeant dans A les lignes et les colonnes; on représente cette matrice 


par _A!,.de sorte. que: 
À = [su | A! = Lars ai, = à; 
On montre sans peine que la règle de transposition d'un produit est : 
RAA CPAS ÉUNAR ARS RS 
d'où l'on déduit que : 
GA) Star 


Lorsque dans(l)ona PQ = E, la transformation est une similitude. 
À et B sont dites transformées l'une de l'autre. Nous avons ainsi : 


(2) Bt = P AP A. = PhET 


La transformée d'un produit est égale au produit des transformées : 
ñ -1 = 
Dan à, D 'rase (P A PIR TE RENER) 


Si dans (1) on a P = Q', on dit que la transformation est congruente. 


Nous avons alors : 


de sorte que 
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Une transformation à la fois congruente et de similitude est une trans- 
formation orthogonale. 
Quand on a affaire à des éléments complexes, on définit les matrices 


* 
net a par: 


a:: = nombre conjugué de à) 
# 
A =. (UN a 


Une transformation telle que : 


est dite conjonctive. 


Une transformation à la fois conjonctive et de similitude est dite unitaire. 


2- MATRICES PARTICULIÈRES 


Nous donnons ci-dessous une liste de matrices de formes particulières 
qui reviennent souvent dans les applications : 


Symétrie A = A! 
Symétrie gauche A set exe Ai 
Pseudosymétrique A+A = 2e 
Réelle ND 
Imaginaire pure ATAS 5 0 
Hermitienne ASE qA‘ {= AI) 
Hermitienne gauche A = - Aù 
Pseudohermitienne A+AŸ = 2E 
Orthogonale A! AA! 
Unitaire A (A 


Dans le domaine réel, les matrices hermitiennes et unitaires devien- 
nent symétriques et orthogonales. 


3. FORME GÉNÉRALE D’UNE MATRICE UNITAIRE 


Etant donné un vecteur complexe : 


<a 2 : 2 
on définit X comme le transposé et conjugué 


nn _ + K * 
X "here: 


et le carré de la ''longueur'' de X comme 


RME rat Ex 
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Ceci posé, on appelle transformation unitaire (de vecteurs) une trans- 


formation conservant les longueurs, c'est-à-dire telle que 


SiY = AX pie Re: 
ou en utilisant les transpositions 
(4) SAS ANR RE 
Nous déduisons de (4) que : 
du de Eee LA 
quel que soit X; c'est-à-dire en explicitant 
(5) Eat a, = 6j noutAl Role é Eté 0 TASA 


ce qui est conforme à une terminologie déja introduite. 
Nous allons montrer que toute matrice unitaire A est de la forme 


(6) lee of du: 


et réciproquement. 
Soit donc À unitaire, satisfaisant par conséquent à 


(7) AAT = E 
Cherchons à résoudre le système 
(8) RC 0 
KHK 2e 25 
a 


Nous résolvons (8) en tirant K* de la deuxième équation, et portant dans 1 


première, ce qui donne 


pu = 


PTE SN CET ET dr 


d'où 
(9) nee ZA EN 


La solution du système (8), si elle existe, est donc (9) 


vérifier que (9) satisfait à (8). 
Nous supposerons À + E non singulière.K et Ki sont donc non singu- 


lières. Le système (8) est alors équivalent à 


Il reste à 


(RTS A RE 
(8!) 
Fe tentée à 
tandis que (9) donne : 
K' = 2(A+E) 
(9) 
(Re ARE) 
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Sous la forme (8') et (9'), la vérification que K, déterminé par (9'), 
satisfait à (8'), est évidente, tenu compte de (7). 


Supposons maintenant À défini par (8). La deuxième équation (8) montre 
que Ket K sont permutables, puisque K s'exprime sous la forme : 


A Ou 


Les inverses de K et K* sont également permutables entre elles et 
avec K et ER On voit alors immédiatement que : 
AGIR) ar dl EN MEERSL EE 
Le raisonnement est en défaut si À + E est une matrice singulière. 
La forme 


EX | 2 
Abe D RUE HR OR. 


où K estune matrice pseudohermitienne complètement arbitraire, est donc 
la forme générale des matrices unitaires. 


Par exemple, la matrice unitaire d'ordre 2 la plus générale s'obtient 
comme suit : 


1 a 1 -à 
Ke 'AEPLE hr + 
LA 1 a* 1 1+ [af 
1 -aa* -2a 
JOURS _ 
240 1-aa* La jeff 


Elle dépend d'un paramètre complexe arbitraire à. 


n (n - 1) 


D'une façon générale, la matrice unitaire d'ordre n dépend de > 
paramètres arbitraires (complexes). 


Dans le domaine réel, lathéorie s'applique aux matrices orthogonales, 
dont la forme générale est : 


OSIES  d avec K +K' = 2E (pseudo-symétrique) 


A doit satisfaire à AA! = E, parce qu'une transformation orthogonale 
doit conserver les distances. La transformation orthogonale la plus géné- 
rale entre les vecteurs (x, y, z) et (X,Y,Z) peut donc se définir par : 


X = u-rv +qw X = u +rv - qw 
VS TUEVES pr DER EU 
Z = -qu+pv +w Z = qu -pv +w 


en éliminant u, v, w (p, q, r sont des paramètres arbitraires). 


CHAPITRE VI 


DES PROBABILITÉS CONDITIONNELLES 


Nous indiquerons dans ce chapitre les principes de Calcul des Pro- 
babilités conditionnelles, de manière que le lecteur puisse s'y reporter 
à propos de la théorie des matrices de corrélation. 


1. - PROBABILITÉ CONDITIONNELLE D'UN ÉVÈNEMENT 


Toute probabilité peut être considérée comme conditionnelle en ce 
sens qu'elle est calculée sous la condition que certaines hypothèses sont 
satisfaites ; cela a été mis en évidence dans l'écriture : 


Pr. E/H | 


Mais il arrive souvent que dans le problème, on pose des hypothèses 
générales, que nous représenterons par exemple par la lettre H, et que 
l'on examine ce qui se passelorsque ces hypothèses se trouvent modifiées. 
Si nous ne considérons que les hypothèses H d'une part, et les différents 


évènements susceptibles de se produire E4, E» .... d'autre part, la seule 
modification à H que nous pouvons faire intervenir est de supposer que l'un 
des évènements E1, E), .... s'est produit. Supposons par exemple que E: 


se soit produit ; l'information que nous possédons sur E» par exemple con- 
siste en H et la connaissance de l'apparition de E, ; nous noterons cette 
information par : 


H et E;,, ou plus brièvement HE], (1) 


et nous déduirons de cette nouvelle information, une nouvelle valeur de la 
probabilité de E,, que nous noterons : 


Pr. | Be/ HE | (2) 
Cette valeur sera en général différente de la valeur ancienne : 
F.. E,/4 | (3) 


et sera appelée probabilité conditionnelle de E, si E s'est produit. 
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On démontre dans les Traités de Calcul des Probabilités, la formule 
des probabilités composées : 


PF. | E,E,/H | DE. 


E;/H | x Pr. | E,/HE, | (4) 


où E, E est une abréviation pour ‘'l'évènement E, et E,". 


La formule (3) permet de calculer l'une quelconque des probabilités 
qui y figurent connaissant les deux autres. 


Si la probabilité (2) est beaucoup plus voisine de (1) que la probabilité 
(3), on peut être tenté de conclure que E>2 est une cause de E, ; cette con- 
clusion n'a pas de fondement ; en effet, la probabilité de (2) faitintervenir 
l'apparition de E,, qui peut être ne décèle que l'existence d'une cause com- 
mune à E, et E, ; nous allons d'ailleurs procéder à un calcul qui montre 
quelle symétrie on peut introduire entre E,;et E,. 


Faisons le quotient de (2) par (3), nous obtenons, en tenant compte de 
(4), et en échangeant ensuite E,et E,. 


Pr. E,/ HE: e Pr E;/HE:) Fe Po | E, E; /H} = A(5) 


Pr. | E/H} : r E/H} | Pr. {E:}.Pr.{E:) 


Nous voyons que l'apparition de E, modifie la probabilité de E, dans la 
même proportion que l'apparition de E, modifie la probabilité de E,. Il n'y 
a donc pas lieu, même si est grand, de considérer E, comme cause de 
E; plutôt que E, comme cause de E,, à moins naturellement que d'autres 
considérations ne viennent appuyer cette affirmation. 


Si À > 1, comme l'apparition d'un des évènements E, ou E, favorise 
l'apparition de l'autre, nous dirons qu'il existe entre E, et E, une corréla- 
tion positive ; si < 1, l'apparition d'un évènement défavorise l'appa- 
rition de l'autre, nous dirons que la corrélation est négative. 


Si A\ =0, les évènements sont indépendants, et la corrélation est dite 
nulle. Il ne faut pas perdre de vue que la grandeur et le signe de la corré- 
lation peuvent dépendre essentiellement de H. 


2. - ÉVÈNEMENTS INDÉPENDANTS 


Dans le cas d'indépendance de Ey et E2, la formule (4) se réduit à : 
Pr. { E,E/H} =Pr. ee {e,/H) (6) 


On peut envisager l'indépendance de deux points de vue ; d'un point de 
vue abstrait et formel, où elle s'exprime par la formule (6), ou d'un point 
concret : deux évènements sont indépendants quand il n'existe aucune 
cause commune où aucune liaison matérielle entre eux. Ces deux points de 
vue coincident quand les probabilités sont suposées déterminées ; ils 
peuvent diverger quand ce n'est pas le cas, comme le montre l' exemple 
suivant. 

Soit une pièce de monnaie telle que l'apparition de face, si on jette la 
pièce, ait une probabilité p, qui puisse prendre les valeurs p, et p:avec 
les probabilités respectives W; et W?. 
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La probabilité d'obtenir face après un premier jet est : 
W, pf+GpP2 (7) 
La probabilité d'obtenir face deux deux jets successifs est : 
Ws pf + Wapà # (@i pi + W2 pa)” 
Nous voyons que les deux coups ne peuvent être considérés comme in- 
dépendants. La probabilité d'obtenir face au deuxième coup est en effet 


égale à (7) si l'on ne sait pas le résultat du premier coup, et à : 


U1 p? + W2p} 
Gp + We pa 


si le premier coup a donné face. Il existe une corrélation entre les évène- 
ments, bien qu'il n'existe entre eux aucune liaison matérielle, et encore 
moins de relation de cause à effet. Cette corrélation tient à ce que le ré- 
sultat du premier jet nous apporte une information nouvelle avant de porter 
des jugements de causalité. 


3. - DISTRIBUTIONS CONDITIONNELLES DE VARIABLES ALÉATOIRES 


Considérons maintenant des variables aléatoires, c'est-à-dire des 


grandeurs numériques X,, X», .... Xn, telles que, quelles que soient les 
valeurs X,, X,, .... Xn, l'évènement E qui a lieu si les inégalités : 
RER REX ARCS ANR NE (8) 


ont lieu a une probabilité bien déterminée : 


pr. {E}s=Pr. {x < x...) SDS ds rl (9) 


Cette probabilité est une fonction des variables x; elle n'est naturelle- 
ment définie que dans un champ d'hypothèses H, que nous sous-entendons, 
mais n'inscrivons pas dans nos formules pour ne pas surcharger l'écriture. 
La fonction P s'appelle fonction de distribution cumulative des variables Xi. 
Si cette fonction peut se mettre sous la forme : 


X{ Xn 
Pa ef DE Pose) RP ET DER (10) 


la fonction p sera appelée fonction de distribution différentielle. Cette fonc- 
tion s'interprète par l'inégalité : 


Pr. | RUE DOME AS. | PÉNALES ue. tds, (11) 

Nous omettrons par la suite les épithètes cumulative et différentielle ; 

pour éviter toute confusion, nous ferons suivre quand le doute sera possi- 
ble les fonctions de distribution différentielle du signe différentiel. 


4. - DISTRIBUTIONS RELATIVES A DEUX VARIABLES CONTINUES 


Dans le cas de deux variables continues, nous aurions, à partir de la 
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fonction de distribution : 
Pr. | A ee urine ie nt de, = Pi (Nix) dx, dx (12) 
1° - les fonctions de distribution marginales : 


Pre { x, ex, xt, } sax f Pr dx 


= p1 (x1) dx, 
(13) 
Pr. e Lt dé NN Py dX 
= Pp2 (x) dx 
2° - les fonctions de distribution conditionnelles : 
Pr. | US R. <xi+dx/X:5 x} re 
2 
L. — P12 (x1:x2) dx: 
(14) 


Pr: Rae Xone 2 He X ne | rt dr. 
1 


—"p21 (25 X3) dx 2 


La corrélation entre deux valeurs x, et x, est indiquée par le rapport : 


Pre Pit Ur U5) 
P: P2 P: P2 


À (x, x) = 


Les variables sont indépendantes si À z=1 quelles que soient les va- 
leurs x, et x, ; pr s'exprime alors en fonction des seules distributions 
marginales : 


Pi = P1 P2 (16) 


5. - DISTRIBUTIONS RELATIVES A TROIS VARIABLES 


Pour plus de deux variables, les formules se compliquent un peu ; 
commençons par le cas de trois variables, que nous supposerons à distri- 
bution continue (les formules relatives à des distributions discontinues se 


déduisent des formules que nous allons obtenir en remplaçant isa f par 
des Z js 
Appelant Py3 dx: dx, dx,la fonction de distribution de X,, X;, X3; 


Pr y SX: < x + des | = Pa dx1 dx2 dx; (17) 


nous obtiendrons : 


1° - La distribution marginale de X,;: 


Pr. | SA PP < x + dx} = dx, jh Py3 dX2 dx3 = ps (x1) dx, (18) 
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2° - La distribution marginale de X, et X, : 


Er | Ky SX = y Ps Lo or TAN CZ 
(19) 
F dxsèxe | P 423 AX3 = Par (X1,%X2) dx dx? 


3° - La distribution conditionnelle de X, connaissant X, : 


P12 (X1 ; X2) dx4 = ee dx; (20) 


(où p2est la distribution marginale de X:). 


4° - La distribution conditionnelle de X, connaissant X,et X3 : 


P 123 
Rio © JE © dx 21) 
Pi.23(%1 5 X2» X3) 1 Psp ( 


où p23 est la distribution marginale de X, et X3. 


5° - La distribution conditionnelle de X, et X, connaissant X3: 


P123 
P 42.3 (ER X9 3 X2) dx, ST ee dx; dx 2 (22) 


où pest la distribution marginale de X;. 


Les cinq catégories de distributions pour chacune desquelles nous 
venons de donner un exemple, comprennent chacune un certain nombre de 
cas, à savoir : 


s 


1° - trois distributions marginales à une variable (X,, X,, X3). 


2° - trois distributions marginales à deux variables: 
(Ka X 35 X3X3 5 X1 Xa) . 
3° - six distributions conditionnelles à une variable supposant connue 


une autre variable. 


4° - trois distributions conditionnelles à une variable supposant les 
deux autres connues. 


5° - trois distributions conditionnelles à deux variables supposant la 
troisième connue. 


Cela fait en tout six distributions marginales et douze distributions 
conditionnelles. 


Pour distinguer ces différentes distributions nous conviendrons d'a- 
dopter les conventions suivantes : 


- une distribution marginale est affectée des indices des variables 
qui y figurent. 


- une distribution conditionnelle est affectée de deux groupes d'in- 
dices, séparés par un point ; les indices du premier groupe sont ceux des 
variables auxquelles la distribution est relative ; les indices du deuxième 
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groupe sont ceux des variables dont la valeur est supposée connue. 


La distribution relative aux trois variables X1, X2, X3 étant Py3 nous 
obtenons les distributions marginales par intégration : 


bi fre dx, dx; P2 LA Pr dx, dx .... 
(23) 


pes [pi dx ; Pa A Dhs Xe. 


et les distributions conditionnelles par formation de quotients : 


12 -Pu 
Pr PA P:3 DT 
(24) 
-_Pra Pr 2JIPS 
P 1.23 pa P2a Pa P123 P3 


6. - DISTRIBUTIONS RELATIVES À UN NOMBRE QUELCONQUE 
DE VARIABLES 


Nous sommes maintenant préparés à traiter le cas d'un nombre quel- 
conque n de variables aléatoires. 


Soient X,, X2 .... Xnces variables et : 
P (ti, X2, .... Xp) 4x4, ... dxn B =512%...n) (25) 
leur fonction de distribution, H étant une abréviation pour l'exemple des 
indices l à n. 


Soit O une combinaison quelconque d'indices pris parmi l'ensemble : 
(e] 070 COS 2 


La distribution marginale des variables correspondantes sera : 


Pa (dx)a = (a / pu dxu ) & ( (27) 


(dx) représentant le produit des différentielles : 


dxi, dx s.. dxi, (28) 


10 
et (dx),)al représentant le produit des différentielles de celles parmi les 
ANSE à ARE s SIREs 
variables X; dont l'indice ne figure pas dans la combinaison « . 
Quant aux distributions conditionnelles, voici comment on les obtient. 


Soient o et (à deux combinaisons d'indices pris dans l'ensemble ; ces 
deux combinaisons sont supposées ne présenter aucun indice commun. 


La fonction de distribution marginale des variables affectées d'indices 
figurant dans à ou {à est : 


Pop = [ Py dx H) af (29) 
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Si nous appelons Pa.p (dx)a la distribution conditionnelle des variables 
dont les indices appartiennent à & , quand les variables dont les indices 
appartiennent à B, sont supposées connues ,nous obtiendrons, d'après lethéo- 


rème des probalités composées : 


Paf Pal 


Pa,B De et par conséquent Pafÿ = es (30) 


Telle est la formule générale donnant les distributions conditionnelles. 
Les formules (32) fournissent des exemples d'application de cette formule 
générale. Donnons encore un exemple pour fixer les idées : soient les cinq 
variables X,, X2, X3, X4, X5, et soit à trouver la distribution conditionnelle. 
de X,et X, connaissant X:et X:. Partant de la fonction de distribution : 


Dies ... Xs) dx: OIDTC dxs 


(nous omettons he 12345 pour simplifier l'écriture), nous aurons d'après 


(29) : 
pre | p dx; Ps= p dx, dx, dxy4 


et d'après (31) 
P 2345 


P 24.35 — 
P3s 


P 2.35 ayant pour signification : 


pr. [x <x RS NOR te MU CT Le lt CR Ka — Le, Xs = xs | 


= P 24.35 dX2 dX4 


Les indications précédemment données suffisent à déterminer les dis- 
tributions conditionnelles dans le cas d'un nombre quelconque de variables. 
Considérons maintenant la question de la corrélation ; d'une manière gé- 
nérale, soient n variables ; dans l'ensemble des indices, considérons deux 
groupes distincts & et (à :nous nous proposons d'étudier la corrélation en- 
tre les variables dont les indices appartiennent à & , que nous appellerons 
brièvement les variables du groupe &, ou plus brièvement encore, les va- 
riables de à et les variables du groupe f. 


a Formons le rapport de la distribution conditionnelle des variables du 
groupe d (quand les variables du groupe (à sont connues) à leur distribution 
marginale. Nous obtenons ainsi : 


Bax;0 Pas 
Pa / Pa Pp 


ap 


(32) 


Aupcaractérisera la corrélation multiple entre les deux groupes de varia- 
bles à et (à . ÀAa.pest une fonction des groupes des variables (x)4et (x)p. 


Considérons maintenant les variables n'appartenant ni au groupe @ ni 
au groupe  ; elles forment un groupe Ÿ (qui peut ne comprendre aucune 
variable si H se partage en à et B ). Si nous formons le quotient de la dis - 
tribution conditionnelle des variables du groupe & (connaissant les valeurs 
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des variables f et Y) à leur distribution conditionnelle connaissant seule- 
ment la valeur des variables Yÿ: nous obtenons le rapport : 


Pa.By Py Py 
Pa,y POy Pay 


À a. (= (33) 


qui caractérise la corrélation partielle entre les groupes « et f3 . 


Nous remarquerons que dans (41) comme dans (40) on peut permuter 
les groupes d'indices à et fi , par suite de la symétrie de ces expressions. 


7. - INDÉPENDANCE MARGINALE, INDÉPENDANCE PARTIELLE 
DE DEUX GROUPES DE VARIABLES 


Deux groupes de variables & et sont considérés comme indépendants 
si, quelles que soient les valeurs supposées connues des variables du grou- 
pe complémentaire Y:il n'existe aucune corrélation entre les deux groupes 
ot et ($ . L'indépendance s'exprime donc en égalant à 1 le quotient Ô , ce qui 
conduit à : 

Pey Pay 


pher (34) 


D ARIANE 


La distribution pp est alors de la forme d'un produit de deux fonctions 
les variables du groupe à figurant dans la première, les variables du grou- 
pe À dans la seconde. 


Remarquons que le fait d'égaler à 1 le quotient À conduit à un résultat 
différent : 


Pap= PaPf (35) 
et n'exprime l'indépendance des groupes & et (3 que dans la distribution 


marginale de cet ensemble de variables. 


Nous pourrons dire que (34) caractérise l'indépendance partielle des 
groupes @& et 5 (dans le groupe qui les comprend tous deux) tandis que (35) 


caractérise l'indépendance marginale. 


L'indépendance marginale et l'indépendance partielle correspondent à 
deux formes différentes de pu. La formule (34) nous fournit déjà la dé- 


composition : 
Ph = Py PpyPay (indépendance partielle) (36) 
Quant à la formule (35), elle nous conduit à la décomposition : 
Pu = Pa PA Py,a,s(indé pendance marginale) (37) 


Or, de toute manière, nous pourrons écrire pour py les décompositions 


suivantes : 
Pyp = Py PG,yPo,P,y (38) 


Py — Pa Pp,aPy;a,f 
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Comparant (36), (37), (38), nous obtenons des conditions nécessaires 
et suffisantes d'indépendance : 


Indépendance partielle : Pay= Pa,ñy (39) 
(ou  PA,y= Péay) 

Indépendance marginale : Ph = Ph (40) 
(ou Pa = Pa,p 


Si l'on cherche à reconnaitre sur la forme de p s'il y a indépendance 
marginale ou partielle, on peut utiliser les propositions suivantes : 


La condition nécessaire et suffisante pour que les variables @& et 
soient indépendantes partiellement est que la fonction de distribution soit 


de la forme : 
P = fayS BY (41) 


où les variables à ne figurent que dans fay, les variables B ne difurent que 
dans gpy. 


La condition nécessaire et suffisante pour que les variables «& et fà 
soient indépendantes marginalement est que la fonction de distribution soit 


de la forme : 


P = fa 88h afy (42) 


où fa ne dépend que des variables à , gp ne dépend que des variables f et 
où h est une fonction telle que son intégrale prise par rapportaux variablesy 
soit une constante (indépendante des variables @& et (à ). 

Que les conditions ci-dessus énoncées soient nécessaires, ceci est é- 


vident au seul examen de (36) et (37). Nous allons démontrer qu'elles sont. 
suffisantes dans le cas de trois variables ; 


Le cas de plus de trois variables se traite de la même manière, en 
substituant le cas échéant des intégrations multiples aux intégrales simples. 


Soient donc trois variables telles que : 


P (x4, Xe, X3) = £ (x,,x3) g (x2,x3) (43) 


Nous avons : 


po=f | fax Pu=s / fax, m=f tx fax, 


L'inégalité (34) est vérifiée. Il y a bien indépendance partielle de X, et 
X). 
Soient maintenant trois variables telles que : 


P (i:X25X3) = Ê (x) 8 (x2) h (x, x2, x3) (44) 
avec : 
fr dx;= K (K constante indépendante de x, et x,). 


Nous voyons immédiatement que : 


pisk£ ff £ex pisKe/ fax 
10 rires ff freres | sax, f gêx=1 


d'où l'égalité (35). 


P12 
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Considérons pour fixer les idées, une distribution de la forme : 
p = À exp. | D LU 22 +4) 2,1, = 2 a,x.x.) (45) 


Cette distribution appartient à une classe de distribution à laquelle 
nous cnsacrerons une étude particulière, sous le nom de distributions 
normales. A est une constante dont la valeur est choisie de manière que : 


fre dx, dx3= 1 


La forine quadratique entre crochets est positive quelles que soient 
les valeurs de x,, x,, xa(ce qui impose à a, a, a; des conditions sur les- 
quelles nous reviendrons plus tard). 


Nous voyons sur (45) que la condition pour que X, et X, soient partiel- 


lement indépendantes est : 
A: 00 (46) 


p est alors de la forme (43). 
Si nous intégrons (45) en x, nous obtenons, comme distribution mar- 
ginale de x, et x, : 


Py2 = B exp. | - Fe Rd - 2a3x, x2- (as x2+ VE 


où B est une nouvelle constante. Nous avons là une expression de la forme 
£ (xs) 8 Ce) si: 


A, à, + as = 0 (47) 


Telle est la condition d'indépendance marginale, qui est tout à fait dif- 
férente de la condition (46). Nous vérifions facilement que si (47) est véri- 


fiée, p peut s'écrire : 
2 
p+A exp. = (1-29) xt exp -(1-af) x | exp |- [es - (a,x, + ax) | 


décomposition qui est bien de la forme (44). 


8. - INDÉPENDANCE COMPLÈTE 


Etant donnés les deux groupes de variables @ et  , nous pourrons en- 
visager une troisième sorte d'indépendance caractérisée par le fait que pp 
est de la forme : 


PH = Pa PR Py 


Nous dirons alors qu'il y a indépendance complète entre les variables 
a et les variables fi . L'indépendance complète entraine naturellement l'in- 


dépendance partielle et l'indépendance marginale. Il est a remarquer que 
s'il y a indépendance partielle entre les groupes & et PB , les groupes P et 
Yet les groupes Y et , il y aindépendance complète entre ces trois grou- 
pes. Nous ne ferons la démonstration que dans le cas de trois variables. 
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Supposons donc que X, et X, soient partiellement indépendantes, ainsi que 
X, et X;, d'une part et X, et X, d'autre part, nous aurons ainsi : 


P = P3 P1.3 P2.3 — P1 P21 Pa: (48) 


Intégrons en x, nous obtenons : 


PatPts EP Pa Pr 


et par conséquent : 


P2.3 = P21 = Pzat (49) 


L'égalité (49) montre que p, 4, ne dépend ni de x,, ni de x,; nous avons 
ainsi : 
P = Pr3 P2.x (%2) 


et en intégrant en x, et x: 


P2z.a — P2 (x) F2p253 


les égalités (48) deviennent alors : 


P = P2P3P13 — P1 P2 P31 (59) 


Tenons compte maintenant de l'indépendance partielle entre X, et X:. 
Nous en déduisons les égalités dérivées de (49) par permutation circulaire 
des indices, en particulier : 


Paie Ps 


ce qui, nous reportant à (59), nous conduit à l'égalité cherchée. 


Dans le cas de la distribution normale, la remarque que nous venons 
de faire est évidente ; si a, = a, = aa = 0, les trois variables sont indépen- 
dantes. Dans le cas particulier de la distribution normale, on vérifie que 
l'indépendance marginale des trois couples : X, X,, X: X3, X3 X, assure 
l'indépendance complète (par suite des restrictions | a | € L,.| 22770 
|a3 | <1limposées à a,, a,, aa. 


| 


CHAPITRE VII 


NOTIONS SUR LA THÉORIE DE L'INFORMATION 


» 


Considérons un système E qui peut prendre n états E,, E,,... Eravec 
des probabilités p,, P2... Pn. Si ces probabilités sont égales, et ont par 
conséquent pour valeur commune 1/7 p, les n états sont placés exactement 
sur le même plan, et on peut donc considérer que E peut prendre effective- 
ment ces n états. Si les probabilités sont inégales, on est amené à consi- 
dérer que E ne prend effectivement qu'un nombre moindre d'états, que l'on 
peut évaluer de la manière suivante. Supposons que n = 2 pour simplifier 
l'exposé. Le système E peut ainsi prendre deux états avec les probabilités 
p et q ; supposons p > q, et cherchons à définir le nombre effectifs d'état, 
soit H que peut prendre E. Pour cela procédons à N expériences. 


Les résultats des expériences peuvent prendre 2" formes différentes 
dont pu" effectivement prises. Pour déterminer Ce nombre H supposons que 
l'on néglige, parmi les 2\ formes possibles, les moins probables, de ma- 
nière que les probabilités cumulées sur ces formes soient & . La probabi- 
lité que dans N épreuves, il y en ait r où E prend la forme E, et N - r où 
il prend la forme E;, est : 


N ! “ 
RP ST 20 SA 


Si nous négligeons les évènements les moins probables, de probabilité 
£ , nous déterminons une limite inférieure pour r, soit R, par la condition: 


Cie 


R 

N ' r CN-r 

en es 1 

à TIN ER PE (1) 
Le nombre des cas surlesquels se trouvent accumulés les probabilités 

restantes, de somme 1 -€ , est donc donné par la formule : 


N N! 
RÉ SEST NES ei 
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Pour N grand, on peut montrer que logk a la valeur asymptotique : 


1 1 
logp = Pos ae) 


La même théorie peut s'appliquer à n > 2, auquel cas, si n éventua- 
lités sont possibles avec probabilités : 


P1 Pers --.. Pn 


le nombre effectif d'éventualités réalisables est}{, défini asymptoti- 
quement par : 


H=logp =- 2 pi log pi 


La quantité H est appelée entropie du système considéré, ou quantité 
d'information (*) nécessaire pour connaitre l'état du système. Le nom de 


S 


quantité d'information est choisi à partir des considérations suivantes : 


Pour connaitre l'état d'un système qui peut prendre deux états égale- 
ment probables, il faut une information. 


Pour connaitre l'état d'un système qui peut prendre quatre états éga- 
lement probables, il faut deux informations, dont la première choisit entre 
(1 ou 2) et (3 ou 4), la seconde achevant la détermination. 


Pour connaitre l'état d'un système qui peut prendre trois états de pro- 
babilités 5 ; - . _ , il faut une information et demie : la première choisit 
entre (1) et (2 ou 3), la seconde entre (2 ou 3) ; comme la seconde informa- 
tion est inutile une fois sur deux en moyenne, cela fait bien 1,5 unité d'in- 


formation. 


On constate, pour les cas simple examinés, que le nombre d'unités 
d'information nécessaires est donné par la formule : 


1-0 2ib lo p 


On montre dans le développement de la théorie que ce résultat est gé- 
néral. 

La notion d'entropie permet de définir d'une manière simple la dépen- 
dance entre deux systèmes. Soient deux systèmes tels qu'il y ait la proba - 
bilité pij pour que le premier soit dans l'état i et le second dans l'état j. 
La probabilité pour le premier système, considéré isolément, d'être dans 
l'état i est : 

TERNITEES. 
Pi 7 Pi) 


La probabilité pour le second d'être dans l'état j est, s'il est consi- 
déré isolément : 


dj= À Pi 


(*) Dans la théorie de l'information, on adopte généralement la base 2 pour les loga- 
rithmes. : 
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Le nombre d'états effectivement pris par le premier système a pour 
logarithme : 


h=- À pilog pi 
En ce qui concerne le second système, ce logarithme est : 
b,=- À qi log x 
En ce qui concerne les deux systèmes considérés simultanément, le 


nombre de couples d'états effectivement réalisable a pour logarithme : 


Hz - Zpilog Pi 


On montre que, quels que soient les Pi; 
EN R;EHhe 


et que l'on a : 
H=h,;+h; 


uniquement si pi; est de la forme : 
Pij= Piq; 
c'est-à-dire si les deux systèmes sont indépendants. 


L'indépendance étant caractérisée par : 
h,+h,-H=0 
on est amené à caractériser la dépendance par la quantité positive : 
h;, +h-H 


Appliquée à deux variables aléatoires X,, X, on est ainsi amené à con- 
sidérer l'intégrale : 


P12 £ 
1 ds dé loi 
1. P12 08 D pe 1 2 8 12 


Ag ayant la signification donnée à la page 7 . 
De même on sera amené à associer à des groupes de variables les 


coefficients : 


M log ne ; M log Ô &,0 (y) 


qui sont des coefficients de cofrélation multiple et partielle. Ces coeffi- 
cients sont essentiellement positifs, et s'annulent uniquement dans les cas 
d'indépendance marginale ou partielle. 


74 


CHAPITRE VIII 


MATRICES ET CORRÉLATION 


1. - CORRÉLATION SIMPLE 


Soient deux variables aléatoires X, et X,; nous supposerons l'existence 
des valeurs moyennes : 


M X; = ai 
(1) 
NL Xi X;j = Mi; 
Si nous substituons à X,, X, les variables centrées : 
X; = 2 _ ai 
nous obtenons, au lieu de M;; quatre moments centrés. 
— 1 
Hi = UC Xi x X; (2) 
que nous pouvons ranger dans une matrice carrée symétrique : 
Hi Mi 
M (3) 
Ha Ha 


Cette matrice est dite matrice des moments attachés aux variables X, 
X,; la forme quadratique : 


= 2 
Qu (u, u,) = Maui +2Hy u u, +} u 
est la valeur moyenne du carré : 
2 
(UE us et) (4) 
elle est donc essentiellement positive. Elle ne peut s'annuler que si, pour 
certaines valeurs u,, u, l'expression (4) est nulle, ce qui entraine l'exis- 


tence d'une relation linéaire entre les variables X! et X}, . I1 s'agit ainsi 
d'une matrice définie positive. 
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Pour interpréter cette matrice, supposons donnée une origine dans un 
plan, et un système de référence constitué par deux vecteurs €; €,, ortho- 
gonaux, de longueur égale a l'unité. Le vecteur : 


Dei te. K: 


a pour extrémité un point aléatoire dans le plan. Soit x un vecteur non aléa- 
toire, de composantes XX 


€ x 


Nous pouvons lui associer le vecteur y : 
VESTE 
y'Rerayétant liés 4%; x, par 


Yi = Hu Xi À Hir Xo 


: Ya = Mai Xi Ÿ H22X2 
1 


La transformation ainsi définie, qui change x 
en y, reste invariante par rotation des axes €,, €; 
soit en effet un troisième vecteur Z° 


— — 
ZI NZ LUI, 


Formons le produit scalaire y X z, Nous obtenons : 


Y 2 = bu X 2 to Cztzix,) thx, 2z 
n(0 ES HZ To en (x 22 +7, x) + sa X2 22 | 


= M LS XD OU 2, FX 23) | 


YX Z 


d'où l'équation indépendante de €; et €, : 
Yxz= N{KR.9IR.2) (5) 


La relation (5) quand X est donné, doit avoir lieu quel que soit Z, Elle 
définit ainsi ÿ en fonction de X, ce qui conduit à la transformation : 


F=€x (6) 


qui ne dépend pas du système €, €, choisi, à condition que ce système soit 
constitué par des vecteurs orthogonaux et de longueur unité (*). 
La forme quadratique Q peut également être définie comme fonction du 


— à à 
vecteur x, puisque : 


D'OR CS (7) 


(*) 11 est bien connu que c'est dans de pareils systèmes de référence que la propriété, 
pour une matrice, d'être symétrique, est invariante. 
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Considérons maintenant la matrice : 


3 1l Le 
Si2 = 
TA il 
où : H12 


F)NENT ES 
V Hu H 22 


Cette matrice se confond avec la matrice M lorsqu'on dévise par 


Vu V Hy les éléments de la première ligne et de la deuxième ligne 


respectivement, ce qui conduit à : 


H12 
Ha 


puisque l'on fait subir la même opération aux colonnes. On voit ainsi que : 


Jun 0 VHr 0 


My = S 32 


0 Hz 0 Vu 


La matrice S,,, dite matrice de corrélation entre X, et X, ne se ratta- 
che pas à une transformation indépendante de e,_et e,. Si nous posons en 
effet : 


& = €; W, + €, w, 


avec Œ, = X, en X3 


W,= rp X, = X9 


Nous voyons que : 


Si la relation entre X et © était indépendante des axes, il en serait de 
même de la relation entre X et ü. Cherchons les vecteurs propres de cette 
dernière transformation. Ils sont définis par : 


d'où : 


Gr 
KAMENEEX 


Les vecteurs propres x sont bissectrices des axes, donc liés à ces 
axes. 
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2. - CORRÉLATIONS A n DIMENSIONS 


. Soient maintenant n variables aléatoires Xi X2s ... Xn que nous re- 
présentons par un vecteur 


—+ 


— — 
X=se;X,te,X,+...+eiXn 


dans un espace à n dimensions rapporté à n vecteurs de référence orthogo- 
naux et de longueur 1. Si nous supposons que : 


MT X; = 0 


ce qui peut toujours être obtenu par un changement d'origine, nous pou- 
vons associer à un vecteur aléatoire X la-matrice des moments : 


Mi2.n© [Has ] Hi = MRXiX; (10) 
Cette matrice peut également s'écrire : 
My.n= M XiX; (1) 


en introduisant la notion de valeur moyenne d'une matrice (matrice for- 
mée en prenant les valeurs moyennes des éléments d'une matrice aléa- 
toire). 


La matrice aléatoire : 


M= [xixi] 


définit une transformation linéaire aléatoire, qui à tout vecteur x(x,,x,..xn) 
associe le vecteur aléatoire Y (Y,, Y,, ... Y:) tel que : 


— 


M = E XiXhxh= Xi(X. %) 


Nous voyons ainsi apparaitre la transformation : 


Tex: (XS x) (12) 


qui associe à un vecteur certain *X un vecteur aléatoire Y, colinéaire Xe 
Il apparait clairement sur (12) que la transformation est indépendante des 
vecteurs ei choisis comme système de référence. Ces vecteurs ei inter- 
viennent simplement pour donner un sens précis au produit scalaire; pour- 
vu qu'ils soient orthogonaux et de longueur 1, peu importe,, en ce qui 
concerne (12),leur position dans l'espace. Si nous prenons la valeur mo- 
yenne de (12), nous obtenons une transformation, non aléatoire : 


ÿ - m[XK.9]-%% (12!) 


de signification indépendante des axes. Cette transformation s'exprime par 
la matrice des moments. La forme de l'équation (12) montre qu'il suffit, 
pour que cette transformationait un sens, que l'on ait défini le produit sca- 
laire de deux vecteurs. La matrice des corrélations S4,.., se définit comme 


Hii Hi 
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d'où l'on tire : 
My..n= diag: [Vra] Sy.n diag. [Vrai] (14) 
| My n | = Hu H22--Han (Se. n | 


La forme quadratique : 
Q (x) = 2 1, Xi X)j 


est définie positive, comme ayant pour valeur : 


3. - VARIABLES NORMALES 


On appelle variable normale toute variable X dont la distribution à la 
forme de la loi de Laplace-Gauss : 


: exp. | re (16) 


oœ V2r 


Nous appellerons variables normales X,, X,... X, tout système de 
variables aléatoires telles que toute combinaison linéaire de ces variables 
soit elle-même une variable normale. 


Nous pourrons supposer, sans diminuer la généralité de la question, 
que les variables considérées ont pour valeur moyenne zéro ; si ce n'était 
pas le cas, il suffirait de leur substituer les variables : 

1 _ * . 
XI! =X;- MX; (17) 


Rappelons que si une variable normale Xa pour distribution : 


f (x) dx 


1 x? 
A — — CD = 
os Ven | 20° Le (18) 


sa fonction caractéristique est : 


6 (0 = Meit* - se, -S) (19) 


et que, réciproquement, toute variable qui a pour fonction caractéristique 
la fonction (29) à pour distribution la fonction (19). 


Soient maintenant les variables X;, centrées, supposées normales et 
soit leur fonction caractéristique : 


Mo exp if Xi +... # tn Xn) | (20) 
= Mo exp [it .X} -çÙ 
Introduisons une variable auxiliaire 


o (x €) = M exp [ia (EE +2 ta Xn) | 


@ (ti, t2... tn) 
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Si t reste fixe, (xt) considérée comme fonction de À n'est autre que 
la fonction caractéristique de la variable ty Xart…. + tn Xn). Cette variable 
combinaison linéaire des Xi, est par hypothèse une variable normale : 
donc @ (Xt) est de la forme (20) : 


4 (D = exp | - D 9 fo peu Fu 


O2? n'est autre que la variance de Lt; X;. Or : 


Ar ti X;)° = M . x)? = > Hi; tit; 


1j 


Faisons À = 1, nous obtenons sans peine : 


w (t) = exp . Dhiütiti (23) 


Procédons à une rotation des axes de manière que la matrice des va- 
riances devienne diagonale. Le vecteur t aura les composantes ti le vec- 
teur x les composantes x;, nous obtiendrons : 


2 2 
2% 


POP MERE SES 


La fonction caractéristique étant le produit de n fonctions de t, Ne tn 
respectivement, les variables X; sont indépendantes ; Xi a pour distribu- 
tion : 


D shine de | A dx; 
Si | 2H 29: 


et la fonction de distribution des X; peut s'écrire (*) : 
I stade #6 |-3x%"%} dti sos: dtg (24) 


CHI ON (2x) 


en effet la transformation % de la formule (12') s'écrit ici : 


4. - DISTRIBUTION NORMALE - CORRÉLATION NORMALE 


Si nous revenons aux variables x,, x,... xn, Comme % et X ont des 
significations invariantes, nous obtenons la distribution : 
l1+o-1— 
il ns |-7* x | en CE (25) 


OR VON NELE 


(*) Par x G À nous entendons le produit scalaire du vecteur X par le vecteur &'' x déduit 
de *X par la transformation G'' inverse de © . 
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Il ne nous reste qu'à exprimer d'une manière invariante les Oi . Con- 
sidérons le déterminant de T; il a pour expression : 


ele Co, MENT 


nous obtenons donc comme type de la distribution normale : 


n 


AU EE. 
FAT exp. {-, XX }ax,.... dx, (26) 


où © est la transformation dont la matrice a pour élément général MX; X;. 


Quant à la fonction caractéristique, elle s'écrit : 


p () = exp. {svt} (27) 


Nous avons trouvé en (26) la forme nécessaire d'une distribution nor- 
male, Il est aisé de démontrer réciproquement que toute combinaison 
linéaire : 

MS ET ME AE neo ous Ce 


est une variable normale. La fonction caractéristique de Y est en effet : 


— 
a 


= Met-q(is ex [-H26 2) 


ce qui est bien la forme (20). 


Quand des variables ont une distribution normale, on dit aussi qu'elles 
sont en corrélation normale, 


5. - DISTRIBUTION NORMALE A DEUX OÙ TROIS PARAMÈTRES 
Nous allons donner deux applications des formules précédentes. Soient 
d'abord deux variables X;, et X, que nous supposons centrées et normées. 
DOTE 
M X, X, = T 42 


La matrice des Hi; est ici : 


l T 42 
My = 
Ty 1 
La matrice inverse est : 
RE 1 l ni? 
12 JE: 
12 
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D'où la distribution : 


Sr dur kit x3 |] dx, dx, (28) 
27 l'=r° 20x27 


Soient maintenant trois variables X3s Xor X3 centrées et normées; pour 
simplifier l'écriture, nous adopterons les notations : 


Ta3 = MX: X3= P; Ty = Mo X3X1 = P: Ty = MX, X3= P; 


La matrice des moments est ici : 


L ps P2 
S 3 = My = | P; 1 P: 
P2 P: 1 


tandis que la matrice inverse est : 
2 
1-P;3 P1 Pa- P35 Pr Ps - Pa 
L 
———————— _ Ê 1e 2, — 
1 Cpi+Ppit+P3)+2P:P2Ps RAI HS 
: : 2 
Pi P3— Pa P2 Ps Prs 1-P3 
Par conséquent le vecteur G'! Ka pour composantes : 


Gap EGP 0r px CP, P3-P2)* 
1 
D 2 np CAP )x+(p:p:-2)% 


(P1P3-P2)X1+ (P2P3-P:)X2+(1-P3)%3 


et la distribution est de 1a forme : 

(2n) 7? #[1-(p?  Doba lt pp: pile 

1 2 2 1 4 24 
DANS aides dois D 90 àar41 C1= pi) x$ + ( P2/X2 
[2 CPP Pit Psle2 pro P:| 
+(1-p3) x3 +2(p2p3-p;) X2 Xs + 2CP3P: = Pa)Xsxs + 2(p1Pa-P3)11%3 |} 

Si l'on désire obtenir les distributions relatives à des variables qui ne 

sont ni centrées ni normées, il suffira de substituer à x; l'expression: 


(x “ a;) Ci 
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6. - DISTRIBUTIONS CONDITIONNELLES ATTACHÉES A UNE 
DISTRIBUTION NORMALE A DEUX OÙ TROIS VARIABLES 


Nous avons exploité py et Pys, par les formules (28) et (29) dans le 
cas d'une corrélation normale. Il nous est possible d'expliciter les distri- 
butions conditionnelles, Nous trouvons ainsi : 


2 
Pr 1 1 (xi-rp X:2) 
P1.2 ee TS D a (30) 
2Tt V l-r$ 2 (ere) 
P123 1 1 (X1 - by X2- bia Xx3)° 
Re ae re on G1) 
23 27 O2 20:23 
RER RE CE MEN) NP er fe 
: 23 31 12 12 273018; 
BE ner more EE Re ET (32) 
1 - re 
T2 — Las Ty 
bi23 = 
lon 
et enfin : 
P23 l 
RE , (33) 


= 2 (rs = rss as) (es - Ty X3) (x2 - Las ni 


7.- NOTION DE VARIANCE COLLECTIVE D'UN SYSTÈME 
DE VARIABLES 


Nous sommes amenés par comparaison des formules (31) (32), (33) 
avec une distribution normale à une variable, à considérer les dénomi- 


nateurs tels que O3 comme des variances de système de variables. Soit 
4 2e = 

d'une manière générale un système de n variables normales, centrées, 

indépendantes : 


X4', Xe Xn 


ps 
et soit X le vecteur représentætif. Considérons n vecteurs indépendants a- 
yant même distribution que X : 


X0 KE... XU 
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Le parallélépipède construit sur ces vecteurs a pour volume la valeur 
du déterminant des coordonnées des X(1), c'est-à-dire : 


(2) 
PACE 


(n) 


Made si 
1 n 


Le carré de ce volume est la somme de (n ‘)? termes de la forme : 


(1) (2) (n) (1) 7 (2) (n) 
Xi, ip es edit Xi, K5, ….X; (35) 


Prenons la valeur moyenne de V?. Seuls auront une valeur moyenne 
différente de 0, les termes (35) ou j =i, (k= 1,2, ... n) par conséquent : 


2k 
M [v?] =}, M C es Po CNE d'u SUE( er ee à 


Si nous convenons donc de considérer comme variance collective des 
X;, la valeur Le du carré du volume du parallélépipède construit sur 
les vecteurs X(), divisée par n ! nous obtiendrons pour cette variance 
l'expression : 


Ch2E ET NI TIONMOL Er ONE | MS ar 


(En effet, on peut toujours par un changement d'axes se ramener au 
cas où les composantes de *X sont indépendantes). 


M | représente le déterminant de la matrice des moments. Comme 
la valeur de | M | reste invariante par rotation d'axes, nous obtiendrons la 
même expression : 


© 32...n =|[ M EU (36) 


même dans le cas où les variables ne sont pas indépendantes (*. 


8. - VARIANCES COLLECTIVES CONDITIONNELLES 


Quand nous aurons affaire à des distributions conditionnelles, nous fe- 
rons intervenir des variances collectives conditionnelles : 


Par exemple nous tirons de (33) : 


On.s — O'123 
dans le cas particulier où &; = 1. Remarquons qu'une variance condition- 
nelle est toujours plus petite qu'une variance non conditionnelle. Par exem- 
pile: 
2 2 2 
O3 O2 De start. hrs let 2) Ta Ty 
© 12 12 lie (37) 


(*) 11 s'agit d'indépendance marginale. 
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Ceci peut s'expliquer en disant que toute information nouvelle diminue 
la variance. Nous reviendrons plus longuement sur ce point quand nous é- 
tudierons les corrélations multiples et partielles. 


9. - CALCUL DES VARIANCES COLLECTIVES A PARTIR DE LA MATRICE 
DES MOMENTS 


La variance collective de n variables apparait en dénominateur dans 
la distribution des variables ; qui est de la forme (en supposant les varia- 
bles centrées) : 


er)" exp {-2X%"X) dx... dx, (38) 
O'2..n 
Soit & un certain groupe de variables d'indicesi,,i, ; ...i,. La va- 


riance collective ee de ces variables est donnée par : 


1 
Ca =|[ M À 


La matrice My se déduisant de la matrice M des moments en n'y con- 
servant que les lignes et les colonnes relatives aux indices œ:. 


Comme la distribution conditionnelle des variables @ connaissant les 
variables f est : 


Paûñ 
PR 


Pa.f = 
nous voyons que la variance collective conditionnelle est donnée par : 


se 
nOGDRE |Mapl? 
Tab Cp Mas 
Mañ représentant la matrice obtenue en conservant dans M, ,les lignes 
et colonnes relatives aux indices à et f. 


Nous voyons ainsi que toutes les variances collectives s'expriment sous 
forme de déterminants ou de quotients de déterminants extraits de la ma- 


trice des moments du deuxième ordre. 


10. - INDÉPENDANCES DE VARIABLES ET DE GROUPES 
DE VARIABLES 


Supposons que les variables X; ne soient pas centrées ; posant : 


x{ 


il 
> 
! 
a 
La 
Il 
% 
! 
o 


(ll 
* 
_ 

1 
p 
= 
bai 
1 
p 

Le 
LA 


bij 


nous reconnaissons en : 
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les coefficients de corrélation des X; prises deux à deux. Dans le cas de 
la corrélation normale, la distribution est entièrement définie quand on se 
donne les a;, O;, Ti. 


Si nous considérons les deux variables X, et X,, la condition Try = 0 
nécessaire pour que les variables soient indépendantes, est ici suffisante 
(de par la forme d'une distribution normale). De même, la condition né- 
cessaire et suffisante pour que deux groupes de variables @ et 9 soient 
indépendants (*) est que l'on ait ri, = 0 pour tout couple d'indices i et j tels 
que i appartienne à © et j à f . Dans ces conditions en effet la matrice Man 
prend la forme : 

Ma 0 
Maf = 


— | ESS 1 — 
(CA >< DA Er = <a | exp l-2 8 Se x6 | (39) 


Si nous considérons trois groupes de variables @,  ,Y , il se peut 
que les groupes @& et f soient indépendants quand les variables ÿ sont con- 
nues, ou inversement. Précisons cela dans le cas de trois variables X;;, 
X,, X3. La condition nécessaire et suffisante pour que X,et X, soient indé- 


pendantes est, quand X, n’est pas connue : 
Ty = 0 (40) 


et, quand X; est connue (distribution pp 3) : 


T42 = T3 la (41) 


Ce sont là deux conditions différentes. Dans le premier cas la loi de 
distribution est de la forme : 


P: (x) P2 (x) P 3.21 (x3, X4» X:) (42) 
dans le deuxième cas, elle est de la forme : 
P3 (x3) P1.3 (is X3) P2.3 (x, X3) (43) 


La seconde forme est la plus facile à déceler ; il suffit en effet pour 
qu'elle se présente, que p;2apuisse s'écrire : 


P123 =  (x4, X3) 8 (x2, X3) (44) 


On dit alors que X, et X, ne sont liés que par l'intermédiaire de X3. 


(*) 11 s'agit d'indépendance marginale. 
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11.- CONDITIONS D’INDÉPENDANCE EXPRIMÉES PAR LES VARIANCES 


Quand X;, et X, sont indépendantes, la connaissance de X3ne doit pas 
modifier la variance de X, ; donc la condition (40) est équivalente à : 


Oi2 —= (45) 


C'est ce que l'on constate sans peine. 

Si X4et X, sont indépendantes quand X;, est connue, la connaissance de 
X,ne doit pas modifier la variance de X,, X;, étant connue ; c'est-à-dire 
que : 


Ti,23 = O3 (46) 
Or (46) s'écrit : 
2 
Th tré 2 Ti los Tu 
Le 1 2 =l-r$ 
7 7A 


ce qui, toutes réductions faites, est bien équivalent à (41). 


De même, la condition nécessaire et suffisante pour que le groupe 
X;, X2 soit indépendant de X, est que : 


Ty = T3 = 0 (47) 


Or, si tel est le cas, la connaissance de X;, ne doit pas modifier la! 
variance coliective de X, et X, : 


Et nous reportant à (37), (48) conduit à : | 
2 2 = 
Tia + T23 7 2 T2 Ta Ty © O0 


ce qui équivaut bien à (47) en tenant compte de la condition | r # | he 


12. - GÉNÉRALISATIONS DE LA NOTION DE COEFFICIENT 
DE CORRÉLATION 


Nous voyons ainsi par ces confrontations de formules, l'importance 
fondamentale de la variance collective, grâce à laquelle on peut exprimer 
toutes les relations d'indépendance entre groupes de variables, Nous pou- 
vons dès maintenant poser les principes de la théorie des corrélations 
multiples et partielles. Nous avons vu que le coefficient de corrélation or- 
dinaire r;, est en relation avec la diminution de variance : 


2 
à Mao 


2 
©“1.2 
2 622 

ER 


C1 late via © 
2 
9° 


(49) 


D'une manière générale, quand la connaissance des valeurs des va- 
riables d'un groupe  diminuera la variance collective d'un groupe & ,nous 


— a —————_———————_—_—_———…— — —————"—"—.—————  —— 
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associerons à ces deux groupes un coefficient de corrélation généralisant 
la formule (49), et poserons : 


can. ; [M os | ; | Sas | 


- Rap 
Mona liMel. [Sc ls 


59 
c£ (59) 


Rag Sera un coefficient de corrélation multiple. Si la formule (59) 
est relative au cas où les variables d'un troisième groupe sont supposées 
connues, nous poserons : 


o?a, By | a6y| [or 
ET LCR to ne [Sa | [56] Gb 


et Ra,B(y) Sera coefficient de corrélation partielle. Les formules (50)e 
(51) A à la notion de variance collective montrent l'unité de nee 
qui existe entre les définitions des différents coefficients de corrélation. 


e (59) et (51) on peut déduire : 
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